我有一个包含元素列表的 Pandas 系列:
import pandas as pd
s = pd.Series([ ['United States of America'],['China', 'Hong Kong'], []])
print(s)
0 [United States of America]
1 [China, Hong Kong]
2 []
如何获得如下系列:
0 United States of America
1 China
1 Hong Kong
我不确定 2 会发生什么。
最佳答案
以下选项均返回 Series。创建一个新框架并列出。
pd.DataFrame(s.tolist()).stack()
0 0 United States of America
1 0 China
1 Hong Kong
dtype: object
要重置索引,请使用
pd.DataFrame(s.tolist()).stack().reset_index(drop=True)
0 United States of America
1 China
2 Hong Kong
dtype: object
要转换为 DataFrame,请调用 to_frame()
pd.DataFrame(s.tolist()).stack().reset_index(drop=True).to_frame('countries')
countries
0 United States of America
1 China
2 Hong Kong
如果您正在尝试编写高尔夫代码,请使用
sum(s, [])
# ['United States of America', 'China', 'Hong Kong']
pd.Series(sum(s, []))
0 United States of America
1 China
2 Hong Kong
dtype: object
甚至,
pd.Series(np.sum(s))
0 United States of America
1 China
2 Hong Kong
dtype: object
但是,与大多数其他涉及列表求和操作的操作一样,这在性能方面很糟糕(列表串联操作效率低下)。
使用 itertools.chain
链接可以实现更快的操作:
from itertools import chain
pd.Series(list(chain.from_iterable(s)))
0 United States of America
1 China
2 Hong Kong
dtype: object
pd.DataFrame(list(chain.from_iterable(s)), columns=['countries'])
countries
0 United States of America
1 China
2 Hong Kong
关于python - 从具有列表元素的系列创建堆叠的 Pandas 系列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54739886/