python - Pandas 数据框中的过滤

标签 python pandas

我将烂番茄的分数按导演分组如下:

director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False)

print director_counts ---> 

Director
Woody Allen             44
Alfred Hitchcock        38
Clint Eastwood          32
Martin Scorsese         29
Steven Spielberg        29
Sidney Lumet            25
...

问题: 对我来说,筛选两部电影以上的导演的最佳方式是什么?

对于按每个导演的平均电影进行过滤,这行得通吗? bigbadpanda.groupby(["导演"]).size().mean())

最佳答案

我根据您的信息创建的数据

Director,Movies
Woody Allen,44
Alfred Hitchcock,38
Clint Eastwood,32
Someone,2
Someone else,1

只需这样做:

df = pd.read_csv('data.txt')

print(df[df.Movies > 2])

输出:

           Director  Movies
0       Woody Allen      44
1  Alfred Hitchcock      38
2    Clint Eastwood      32

关于python - Pandas 数据框中的过滤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31375045/

相关文章:

python - Pandas 使用线程池对庞大数据集的多列进行排名

python - matlib 绘制每个条目的图表,想要每个国家/地区的合并总数

python - 估计的自由度不足

python - 如何从基于三列的DataFrame中提取数据?

python - 指定方法的参数类型和返回类型有什么好处?

python - 在 scikit-learn 中自动选择几个估计器中最好的一个

python - 使用python从矩形图像创建非矩形图像

python - 如何运行Python子进程和流,同时过滤stdout和stderr?

python - Pandas :更改列中的数据类型,然后将两列相乘

python - 参数 ?不使用 python postgres