python - 在 Python 中将带有选定列标题的 CSV 读取到一个 CSV 文件中(按行读取)

标签 python pandas

我有一个问题。我想遍历包含以下内容的 csv 文件的文件夹:名称中包含“usr666”,然后仅通过选定的列标题将它们加载到 pandas 数据框中,并将它们合并到一个文件中,如下例所示:

BT_usr666.csv: 
number|size|person|car    |
---------------------------
31     |2   |Ringo |Tesla  |
82     |3   |Paul  |Audi   |
93     |2   |John  |BMW    |
74     |3   |George|MG     |


RS_usr666.csv:

number|color|person|doors|car    |
---------------------------------
33    |black|Mick  |2    |Porsche|
12    |red  |Keith |4    |Saab   |
55    |blue |Ron   |6    |Volvo  |

into FINAL_usr666.csv

person|car    |
---------------
Ringo |Tesla  |
Paul  |Audi   |
John  |BMW    |
George|MG     |
Mick  |Porsche|
Keith |Saab   |
Ron   |Volvo  |

有什么想法吗?

最佳答案

这个可以做到

这将搜索“.”中的文件。即当前目录并查找以 usr666 开头的文件并执行您所要求的操作

import pandas as pd
import os
x=pd.DataFrame()
for filename in sorted(os.listdir(".")):
    if filename.startswith("usr666"):
        y=pd.read_csv(filename)
        selected=y[["person","car"]]
        x=x.append(selected)
        x.to_csv('file1.csv',index=True)

关于python - 在 Python 中将带有选定列标题的 CSV 读取到一个 CSV 文件中(按行读取),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58269618/

相关文章:

python - Pandas :绕过数字索引

python - Tensorflow:将 `tf.data.Dataset` 迭代器转换为张量

python - SQLAlchemy:检查给定值是否在列表中

python - 如何修复 StreamlitAPIException : ("Expected bytes, got a ' int' object", 'Conversion failed for column FG% with type object' )

python - 如何根据前面的列填充 NaN 值

python - 无法将表写入 Pandas DataFrame

python - IFFT 在 Python 中返回什么?

javascript - 如何从日期中检索星期几

python - 拆分 pandas DataFrame 中的单元格并计算值

python - 在 Pandas 中合并具有相同列名但列数不同的两个数据框