python - 在不同的列上连接数据帧

标签 python pandas

我有 3 个不同的 csv 文件,我正在寻找 concat 值。我需要的唯一条件是第一个 csv 数据帧必须在新 csv 的 A 列中,第二个 csv 数据帧在 B 列中,第三个 csv 数据帧在 C 列中。所有 csv 文件的行数相同。 我还需要将三个 header 更改为 ['año_pasado','mes_pasado','este_mes']

import pandas as pd

df = pd.read_csv('año_pasado_subastas2.csv', sep=',')

df1 = pd.read_csv('mes_pasado_subastas2.csv', sep=',')

df2 = pd.read_csv('este_mes_subastas2.csv', sep=',')

df1
>>>
Subastas
166665859
237944547
260106086
276599496
251813654
223790056
179340698
177500866
239884764
234813107

df2
>>>
Subastas
212003586
161813617
172179313
209185016
203804433
198207783
179410798
156375658
130228140
124964988

df3
>>>
Subastas
142552750
227514418
222635042
216263925
196209965
140984000
139712089
215588302
229478041
222211457

我需要的输出是:

año_pasado,mes_pasado,este_mes
166665859,124964988,142552750
237944547,161813617,227514418
260106086,172179313,222635042
276599496,209185016,216263925
251813654,203804433,196209965
223790056,198207783,140984000
179340698,179410798,139712089
177500866,156375658,215588302
239884764,130228140,229478041
234813107,124964988,222211457

最佳答案

我想你需要concatsqueeze=True 创建的 Series 如果只有一列数据或选择列并且对于新列名称使用参数 keys:

df = pd.read_csv('año_pasado_subastas2.csv', squeeze=True)
df1 = pd.read_csv('mes_pasado_subastas2.csv', squeeze=True)
df2 = pd.read_csv('este_mes_subastas2.csv', squeeze=True)

cols = ['año_pasado','mes_pasado','este_mes']
df = pd.concat([df, df1, df2], keys = cols, axis=1)

或者:

df = pd.read_csv('año_pasado_subastas2.csv')
df1 = pd.read_csv('mes_pasado_subastas2.csv')
df2 = pd.read_csv('este_mes_subastas2.csv')

cols = ['año_pasado','mes_pasado','este_mes']
df = pd.concat([df['Subastas'], df1['Subastas'], df2['Subastas']], keys = cols, axis=1)

print (df)
   año_pasado  mes_pasado   este_mes
0   166665859   212003586  142552750
1   237944547   161813617  227514418
2   260106086   172179313  222635042
3   276599496   209185016  216263925
4   251813654   203804433  196209965
5   223790056   198207783  140984000
6   179340698   179410798  139712089
7   177500866   156375658  215588302
8   239884764   130228140  229478041
9   234813107   124964988  222211457

关于python - 在不同的列上连接数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48223211/

相关文章:

python - 基于href自动访问多个页面抓取数据

python 从日期时间对象获取时区值

python - 根据日期拆分数据框

python + pandas - 将 df 转储到循环中的 excel

python - 绘制 Pandas 时间增量

python - Python Reportlab 中的动态帧大小

python - 根据条件打乱数据帧的行

python - PySpark - 带有 lambda 函数的映射

python - 基于默认值列替换多列中的 NaN 的最有效方法是什么?

Python/Pandas - 删除不重复的行