2023年2月14日 21:42:50go评论70阅读模式

英文:

Writing a DataFrame to an excel file where items in a list are put into separate cells

问题

考虑一个名为pivoted的数据框，其中一些数据的复制以数据框中的列表形式给出：

import pandas as pd

d = {'Compound': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C'],
     'Conc': [1, 0.5, 0.1, 1, 0.5, 0.1, 2, 1, 0.5, 0.1],
     'Data': [[100, 90, 80], [50, 40, 30], [10, 9.7, 8], 
              [20, 15, 10], [3, 4, 5, 6], [100, 110, 80],
              [30, 40, 50, 20], [10, 5, 9, 3], [2, 1, 2, 2], [1, 1, 0]]}

df = pd.DataFrame(data=d)
pivoted = df.pivot(index='Conc', columns='Compound', values='Data')

可以将这个数据框写入Excel文件，如下所示：

with pd.ExcelWriter('output.xlsx') as writer:
    pivoted.to_excel(writer, sheet_name='Sheet1', index_label='Conc')

希望的Excel文件中，如何改为将复制数据放在相邻单元格中？希望的Excel文件如下：

如何改为将复制数据放在相邻单元格中？

你可以使用以下代码将数据重新排列，然后将其写入Excel文件：

# 重新排列数据框
rearranged = pd.DataFrame(pivoted.stack().values.tolist(), index=pivoted.stack().index, columns=pivoted.stack().columns)

# 写入Excel文件
with pd.ExcelWriter('desired_output.xlsx') as writer:
    rearranged.to_excel(writer, sheet_name='Sheet1', index_label='Conc')

这将把复制数据放在相邻单元格中，并创建你所期望的Excel文件。

英文:

Consider a dataframe like pivoted, where replicates of some data are given as lists in a dataframe:


d = {&#39;Compound&#39;: [&#39;A&#39;, &#39;A&#39;, &#39;A&#39;, &#39;B&#39;, &#39;B&#39;, &#39;B&#39;, &#39;C&#39;, &#39;C&#39;, &#39;C&#39;, &#39;C&#39;],
     &#39;Conc&#39;: [1, 0.5, 0.1, 1, 0.5, 0.1, 2, 1, 0.5, 0.1],
     &#39;Data&#39;: [[100, 90, 80], [50, 40, 30], [10, 9.7, 8], 
              [20, 15, 10], [3, 4, 5, 6], [100, 110, 80],
              [30, 40, 50, 20], [10, 5, 9, 3], [2, 1, 2, 2], [1, 1, 0]]}

df = pd.DataFrame(data=d)
pivoted = df.pivot(index=&#39;Conc&#39;, columns=&#39;Compound&#39;, values=&#39;Data&#39;)

This df can be written to an excel file as such:

with pd.ExcelWriter(&#39;output.xlsx&#39;) as writer:
    pivoted.to_excel(writer, sheet_name=&#39;Sheet1&#39;, index_label=&#39;Conc&#39;)

How can this instead be written where replicate data are given in side-by-side cells? Desired excel file:

答案1

得分: 4

以下是代码部分的翻译：

首先，您需要以稍微不同的方式对数据进行转换，首先使用explode来展开"Data"列，然后使用groupby.cumcount进行去重：

(df.explode('Data')
   .assign(n=lambda d: d.groupby(level=0).cumcount())
   .pivot(index='Conc', columns=['Compound', 'n'], values='Data')
   .droplevel('n', axis=1).rename_axis(columns=None)
)

输出结果：

        A    A    A    B    B    B    B   C   C   C    C
Conc                                                        
0.1    10  9.7    8  100  110   80  NaN   1   1   0  NaN
0.5    50   40   30    3    4    5    6   2   1   2    2
1.0   100   90   80   20   15   10  NaN  10   5   9    3
2.0   NaN  NaN  NaN  NaN  NaN  NaN  NaN  30  40  50   20

英文:

Then you need to pivot your data in a slightly different way, first explode the Data column, and deduplicate with groupby.cumcount:

(df.explode(&#39;Data&#39;)
   .assign(n=lambda d: d.groupby(level=0).cumcount())
   .pivot(index=&#39;Conc&#39;, columns=[&#39;Compound&#39;, &#39;n&#39;], values=&#39;Data&#39;)
   .droplevel(&#39;n&#39;, axis=1).rename_axis(columns=None)
)

Output:

        A    A    A    B    B    B    B   C   C   C    C
Conc                                                        
0.1    10  9.7    8  100  110   80  NaN   1   1   0  NaN
0.5    50   40   30    3    4    5    6   2   1   2    2
1.0   100   90   80   20   15   10  NaN  10   5   9    3
2.0   NaN  NaN  NaN  NaN  NaN  NaN  NaN  30  40  50   20

答案2

得分: 2

除了@mozway的答案外，仅供格式化，您可以使用以下代码：

piv = (df.explode('Data').assign(col=lambda x: x.groupby(level=0).cumcount())
         .pivot(index='Conc', columns=['Compound', 'col'], values='Data')
         .rename_axis(None))
piv.columns = pd.Index([i if j == 0 else '' for i, j in piv.columns], name='Conc')
piv.to_excel('file.xlsx')

英文:

Beside the @mozway's answer, just for formatting, you can use:

piv = (df.explode(&#39;Data&#39;).assign(col=lambda x: x.groupby(level=0).cumcount())
         .pivot(index=&#39;Conc&#39;, columns=[&#39;Compound&#39;, &#39;col&#39;], values=&#39;Data&#39;)
         .rename_axis(None))
piv.columns = pd.Index([i if j == 0 else &#39;&#39; for i, j in piv.columns], name=&#39;Conc&#39;)
piv.to_excel(&#39;file.xlsx&#39;)

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

将DataFrame写入Excel文件，其中列表中的项目被放入单独的单元格。

问题

答案1

答案2

如何在SQLalchemy中创建列时声明datetime范围？

我可以展示数据集列的分布，按特定方式排列图像吗？

循环遍历数据子集的组合以进行处理。

如何从数组变量中检索结果以及为什么它不能在本地解决。

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论