python - Pandas 数据框中的过滤

我将烂番茄的分数按导演分组如下:

director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False)

print director_counts ---> 

Director
Woody Allen             44
Alfred Hitchcock        38
Clint Eastwood          32
Martin Scorsese         29
Steven Spielberg        29
Sidney Lumet            25
...

问题: 对我来说，筛选两部电影以上的导演的最佳方式是什么？

对于按每个导演的平均电影进行过滤，这行得通吗？ bigbadpanda.groupby(["导演"]).size().mean())

最佳答案

我根据您的信息创建的数据

Director,Movies
Woody Allen,44
Alfred Hitchcock,38
Clint Eastwood,32
Someone,2
Someone else,1

只需这样做:

df = pd.read_csv('data.txt')

print(df[df.Movies > 2])

输出:

           Director  Movies
0       Woody Allen      44
1  Alfred Hitchcock      38
2    Clint Eastwood      32

关于python - Pandas 数据框中的过滤，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31375045/

上一篇：python - 在 Pandas Python 中根据唯一列键对数据进行分组并连接(数据透视表)

下一篇：python - 从 div 中提取信息并使某些字段成为其他字段的父字段

相关文章：

python - Pandas 使用线程池对庞大数据集的多列进行排名

python - matlib 绘制每个条目的图表，想要每个国家/地区的合并总数

python - 估计的自由度不足

python - 如何从基于三列的DataFrame中提取数据？

python - 指定方法的参数类型和返回类型有什么好处？

python - 在 scikit-learn 中自动选择几个估计器中最好的一个

python - 使用python从矩形图像创建非矩形图像

python - 如何运行Python子进程和流，同时过滤stdout和stderr？

python - Pandas :更改列中的数据类型，然后将两列相乘

python - 参数？不使用 python postgres