文件夹中有大约 200 个文件的列表。每个都有相同数量的列,但命名可能会有所不同。例如,我可以有全局 ID 或全局 ID 或全局 ID。有没有办法控制 pandas 列名称中的大小写,以便它等于什么并不重要?目前,它将遍历 200 个文件中的前 15 个左右,并且会出错,因为它找不到全局 ID。
请注意,我是一个初学者,仍在学习中。
import pandas as pd
import glob
with open('test99.txt' , 'a') as out:
list_of_files = glob.glob('M:\AD HOC Docs\Client\Blinded\*')
for file_name in list_of_files:
df = pd.read_table(file_name, low_memory=False)
df['Client'] = file_name.split("_")[2].strip()
Final = df[['Client','ClientID','Global ID','Internal ID','campaign type','engagement type', 'file_name']]
Final.to_csv(out,index=False)
最佳答案
使用 header=None, name=[要使用的列名称列表]
作为 read_table
的附加参数,以忽略标题行并获得一致的名称。
关于Python - Pandas 组合多个文件的部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39985151/