我想更改 3 个数据集的公共(public)变量名称 然后合并它们,但似乎重命名并没有将 var name 更改为 EID, 我该如何解决?
此外,我可以使用 pd.merge 命令合并 3 个数据集,而不是对所有数据集进行 1:1 处理吗?
谢谢
data1516 = pd.read_csv('C:/data2015_2016.csv', sep='|', names=None, header=1, encoding='latin-1')
data1617 = pd.read_csv('C:/data2016_2017.csv', sep='|', names=None, header=1, encoding='latin-1')
data1718 = pd.read_csv('C:/data2017_2018.csv', sep='|', names=None, header=1, encoding='latin-1')
data1516.rename(index=str, columns={"Employer: ID" : "EID"})
data1617.rename(index=str, columns={"Employer: ID" : "EID"})
data1718.rename(index=str, columns={"Employer: ID" : "EID"})
data1517 = pd.merge(data1516, data1617, on='EID', how='outer')
最佳答案
这应该可以解决问题:
dfs = [data1516, data1617, data1718]
df = pd.concat([x.rename(columns={"Employer: ID" : "EID"}) for x in dfs], axis=1)
关于Python Pandas - 重命名和合并 3 个数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46914781/