我有以下数据框,其中包含列 ID_x
和 ID_y
,其中包含用单个空格分隔的数据:
df = pd.DataFrame({
'fruit':['apple','orange','banana'],
'ID_x' : ['1 2 3','4','5'],
'ID_y' : ['A B', 'C D','E']
}, index=['0','1','2'])
我想要拆分列中的每个值(ID_x
和 ID_y
)并创建新行,以便每行代表拆分值的一一对应关系.
类似这样的事情:
知道如何解决这个问题吗?
到目前为止我尝试过拆分列中的值:
col_x = 'ID_x'
col_y = 'ID_y'
df = df_unflat.assign(**{col_x:df_unflat[col_x].str.split(' ')})
df = df_unflat.assign(**{col_y:df_unflat[col_y].str.split(' ')})
最佳答案
试试这个方法:
import pandas as pd
df = pd.DataFrame({
'fruit':['apple','orange','banana'],
'ID_x' : ['1 2 3','4','5'],
'ID_y' : ['A B', 'C D','E']
}, index=['0','1','2'])
id_x = df['ID_x'].str.split(' ').apply(Series, 1).stack()
id_y = df['ID_y'].str.split(' ').apply(Series, 1).stack()
id_x.index = id_x.index.droplevel(-1)
id_y.index = id_y.index.droplevel(-1)
id_x.name = 'ID_x'
id_y.name = 'ID_y'
del df['ID_x']
del df['ID_y']
df = df.join(id_x)
df = df.join(id_y)
df.reset_index(drop=True)
输出:
fruit ID_x ID_y
0 apple 1 A
1 apple 1 B
2 apple 2 A
3 apple 2 B
4 apple 3 A
5 apple 3 B
6 orange 4 C
7 orange 4 D
8 banana 5 E
关于python - 如何使数据框中的每一行的每一列都有一个值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44080909/