问题

我尝试从文件夹中的多个CSV文件中读取数据，选择特定列，将文件名作为附加列，最后将数据写入现有的Excel文件。

打印输出实现了我想要的效果，但似乎无法让数据附加到Excel表格中。

import requests
import os
import pandas as pd
import time
import xlwt
import glob

files = glob.glob("*.csv")

writer = pd.ExcelWriter('output.xls', engine='xlsxwriter')
writer.close()

for i in files:

    df = pd.read_csv(i, usecols=['column1', 'column2'])
    df['Filename Column'] = i.split(".")[0]
    df.to_csv(i.split(".")[0] + ".csv")
    print(df)
    df_combined = pd.concat([df])
    reader = pd.read_excel(r'output.xls')
    df_combined.to_excel(writer, index=False, startrow=len(reader) + 1)

使用这种方式Excel 仍然为空。

英文:

I'm trying to read out data from multiple csv files in a folder, selecting specific column, adding the file name as an additional column and finally writing this to an existing excel.

The print output does what I'd like to do, but I don't seem to get the part working, where the data are attached to the excel sheet.

import requests
import os
import pandas as pd
import time
import xlwt
import glob


files = glob.glob(&quot;*.csv&quot;) 

writer = pd.ExcelWriter(&#39;output.xls&#39;, engine=&#39;xlsxwriter&#39;)
writer.close()

for i in files:
    
    df=pd.read_csv(i, usecols = [&#39;column1&#39;, &#39;column2&#39;])
    df[&#39;Filename Column&#39;] = i.split(&quot;.&quot;)[0]
    df.to_csv(i.split(&quot;.&quot;)[0]+&quot;.csv&quot;)
    print(df)
    df_combined = pd.concat([df])
    reader = pd.read_excel(r&#39;output.xls&#39;)
    df_combined.to_excel(writer, index=False, startrow=len(reader)+1)

The Excel remains empty, when I do it like that.

答案1

得分: 0

以下是您提供的代码的翻译部分：

import glob
import pandas as pd
from typing import List

if __name__ == "__main__":
    final_df: pd.DataFrame = pd.read_excel("dataset.xlsx", engine="openpyxl")

    files: List = glob.glob("*.csv")
    for file in files:
        added_df: pd.DataFrame = pd.read_csv(file, usecols=["column1", "column3"])
        added_df["Filename"] = file.split(".")[0]
        final_df: pd.DataFrame = pd.concat([final_df, added_df])

    final_df.to_excel("dataset.xlsx", index=False)

希望这对您有所帮助。

英文:

This code is what I've come up with.

import glob
import pandas as pd
from typing import List


if __name__ == &quot;__main__&quot;:
    final_df: pd.DataFrame = pd.read_excel(&quot;dataset.xlsx&quot;, engine=&quot;openpyxl&quot;)

    files: List = glob.glob(&quot;*.csv&quot;)
    for file in files:
        added_df: pd.DataFrame = pd.read_csv(file, usecols=[&quot;column1&quot;, &quot;column3&quot;])
        added_df[&quot;Filename&quot;] = file.split(&quot;.&quot;)[0]
        final_df: pd.DataFrame = pd.concat([final_df, added_df])

    final_df.to_excel(&quot;dataset.xlsx&quot;, index=False)

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

在Python中，使用多个CSV文件的数据将新行附加到现有的Excel表格中。

问题

答案1

如何正确使用boto3的if语句

使用Python将数据写入Excel文件，并将文本保存在精确的单元格中。

从Python字典中根据索引获取特定键。

在Termux上使用pip安装pypi包不起作用。

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论