我有以下数据框,我想使用应用程序列名称来计算类别出现的次数。由于没有数字列,因此 newapp = newapp.groupby(['App']).mean()
不起作用。
newapp = apps.drop([ 'Genres','Reviews','Content Rating','Size','Size','Type','Price'], axis=1)
newapp = newapp[newapp.get('Installs')>=1000000]
newapp1 = newapp[newapp.get('Rating')>=4]
newapp = newapp1.drop(['Rating','Installs'], axis=1)
newapp
完整的数据框:
预期输出是拥有最好应用程序的类别,其中好的应用程序安装量至少为 100 万且评分至少为 4:
游戏
最佳答案
我认为你需要:
newapp[newapp['Installs'].ge(1000000) & newapp['Rating'].ge(4)].groupby('Category')['App'].size().idxmax()
关于python - 如何计算列中类型为 str 的行相对于其类别的出现次数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59915173/