Python Pandas - 重命名和合并 3 个数据集

标签 python pandas merge rename

我想更改 3 个数据集的公共(public)变量名称 然后合并它们,但似乎重命名并没有将 var name 更改为 EID, 我该如何解决?

此外,我可以使用 pd.merge 命令合并 3 个数据集,而不是对所有数据集进行 1:1 处理吗?

谢谢

data1516 = pd.read_csv('C:/data2015_2016.csv', sep='|', names=None, header=1, encoding='latin-1')    
data1617 = pd.read_csv('C:/data2016_2017.csv', sep='|', names=None, header=1, encoding='latin-1')    
data1718 = pd.read_csv('C:/data2017_2018.csv', sep='|', names=None, header=1, encoding='latin-1')

data1516.rename(index=str, columns={"Employer: ID" : "EID"})    
data1617.rename(index=str, columns={"Employer: ID" : "EID"})    
data1718.rename(index=str, columns={"Employer: ID" : "EID"})    
data1517 = pd.merge(data1516, data1617, on='EID', how='outer')

最佳答案

这应该可以解决问题:

dfs = [data1516, data1617, data1718]
df = pd.concat([x.rename(columns={"Employer: ID" : "EID"}) for x in dfs], axis=1)

关于Python Pandas - 重命名和合并 3 个数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46914781/

相关文章:

python - 如何在 Pandas/Numpy 中同时实现具有非重叠和滚动特征的函数?

Git merge 不会第二次 merge 文件

git merge : is there a way to force --squash?

python - 通过命令行在 Ubuntu(或 Linux)上安装 Anaconda

python - 使用 pandas 中的列条件更改特定行中的值

python - 按键连接数据框 - 重复数据作为新列

git - 如何使用 Git 和命令行在 merge 期间保留本地文件或远程文件?

python - Cython 函数指针解引用时间(与直接调用函数相比)

python - 如何从 Python 2.7 中的 csv 读取数据中找到最大数量?

javascript - 在页面加载时加载时间戳并将其与表单提交时的时间戳进行比较