在 Python 中将具有不同标题的多个 CSV 文件合并到一个文件中

在 Python 中将具有不同标题的多个 CSV 文件合并到一个文件中

在使用 CSV 文件进行数据分析时,我们可能需要处理大型数据集。在这些情况下,我们必须将所有数据合并到一个 CSV 文件中。按照下面给出的示例,我们将学习如何使用 Python 连接 CSV 文件。

先决条件

如果您的计算机上还没有最新版本的 Python,请下载并安装它。

下载链接: https://www.python.org/downloads/

安装成功后,我们必须安装pandas包。

安装熊猫

打开终端并使用以下命令安装 pandas。

 点安装熊猫

现在让我们假设您有一个包含各种标题的 CSV 文件。然后必须合并标题名称。

例子

第一个 CSV

第二个 CSV

第三个 CSV

例如,您需要提取下面列出的标头值。

CompanyType、companySize、域、成立、tagLine、网站

导入所有需要的包。

 从 csv 导入 DictReader  
 导入全局  
 进口我们  
 将熊猫导入为 pd

获取 CSV 文件夹路径。

 路径 = os.getcwd()  
 csv_files = glob.glob(os.path.join(path, "*.csv"))

定义输出 CSV 标头。

 modifiedHeaders = ['CompanyType', 'companySize', 'domain', 'founded', 'tagLine,website']

从指定文件夹读取 CSV 文件并将它们写入单个文件。

完整的脚本

带有所选标头的 formatted.csv 文件将包含最终输出。

结论

我希望它对您有很大帮助,并为您节省大量时间。请关注我的页面并对我的帖子发表评论。

谢谢 !!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/7568/13300108

posted @ 2022-09-01 08:14  哈哈哈来了啊啊啊  阅读(257)  评论(0编辑  收藏  举报