所以我有一个数据框,其中有一列如下:
Fruit
apple;banana
pear;apple;peach
blueberry;durian;apple;peach
banana;grape;orange
.
等等。我想创建一个最终列表,我可以在其中获取以下列表:
fruitList = ['apple','banana','pear','apple','peach','blueberry','durian','peach','banana','grape','orange']
我该怎么做?我设法对单行执行此操作,如下所示:
fruitList.extend(df['Fruit'].iloc[0].split(';'))
#fruitList = ['apple','banana']
但是,当然,这只适用于一行......我如何概括这一点?我的计划只是计算水果数量并获得前 10 个水果数量。我的最终目标只是保留包含前 10 名水果的行...但是要实现这一目标,我首先要如何提出 fruitList
呢?
最佳答案
df.Fruit.str.split(';').sum()
查看完整代码Microsft Azure Notebook .
关于python - Pandas - 拆分数据框中列的每个元素并添加到列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47243861/