python - 是否可以在不阅读的情况下连接(合并)csv 文件? ( python ,木星)

标签 python pandas csv merge jupyter

我的路径中有 2 个 csv 文件。我想在不阅读的情况下连接或合并 2 个文件。这是针对数据加载问题和合并错误(大量数据)

my folder/a.csv
my folder/b.csv

使用>制作a.csv + b.csv/不使用pd.read_csv

最佳答案

实现此目的的一种选择是使用 dask:

from dask.dataframe import read_csv, concat

df1 = read_csv('my folder/a.csv')
df2 = read_csv('my folder/b.csv')

final_df = concat([df1, df2])

final_df.to_csv('combined.csv', index=False, single_file=True)

这可以很容易地扩展到多个 csv 的情况(假设它们具有相同的列结构):

from dask.dataframe import read_csv

final_df = read_csv('my folder/*.csv')
final_df.to_csv('combined.csv', index=False, single_file=True)

关于python - 是否可以在不阅读的情况下连接(合并)csv 文件? ( python ,木星),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72598245/

相关文章:

python - 如何在pandas系列中按索引提取元素

python - Pandas - 如何交换列内容,保持标签序列完整?

python - 修补 Python 中 CSV 文件中缺失的行

java - 我在使用此代码将 csv 转换为 json 架构时收到此错误

python - 一个 Hot Encoding 列中有多个标签

math - 使用 PowerShell 根据另一列中的信息添加(数学)CSV 的列

用于多维数组循环的 Python 多处理内存管理

python - 为什么 __getattribute__ 失败并返回 : TypeError: 'NoneType' object is not callable

python - django登录到上一页

python - 如何用 python "join"两个文本文件?