python - Pandas - Groupby 并创建新的 DataFrame?

标签 python pandas grouping data-analysis

这是我的情况-

In[1]: data
Out[1]: 
     Item                    Type
0  Orange           Edible, Fruit
1  Banana           Edible, Fruit
2  Tomato       Edible, Vegetable
3  Laptop  Non Edible, Electronic

In[2]: type(data)
Out[2]: pandas.core.frame.DataFrame

我想做的是创建一个只有 Fruits 的数据框,所以我需要 groupby 这样 Fruit 存在于类型

我试过这样做:

grouped = data.groupby(lambda x: "Fruit"in x, axis=1)

我不知道这是否是这样做的方式,我在理解 groupby 时遇到了一些困难。我如何获得只有 Fruits 的新 DataFrame

最佳答案

你可以使用

data[data['Type'].str.contains('Fruit')]

import pandas as pd

data = pd.DataFrame({'Item':['Orange', 'Banana', 'Tomato', 'Laptop'],
                     'Type':['Edible, Fruit', 'Edible, Fruit', 'Edible, Vegetable', 'Non Edible, Electronic']})
print(data[data['Type'].str.contains('Fruit')])

产量

     Item           Type
0  Orange  Edible, Fruit
1  Banana  Edible, Fruit

关于python - Pandas - Groupby 并创建新的 DataFrame?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20951840/

相关文章:

python - 在 pandas 数据系列中获取 NAN 索引的最佳方法是什么

python - 我有一个 Pandas 数据框,每周有几周和几天。如何考虑日期与日期匹配的行?

python - 如何在 Pandas 中重新采样数据帧字典(雅虎数据)?

python - Python 中根据列相似性对数据框进行分组

java - java 8中的Group By具有多级分组

python - 将 Excel 工作表添加到工作簿末尾

python - 非线性颜色图/热图

python - 排序值,类型错误 : '<' not supported between instances of 'numpy.ndarray' and 'str'

python - 索引操作 (.loc) ([ ]) 和 (.) 有什么区别

python - 当其中的nan值时如何获取Pandas DataFrame中的最大/最小值