python - 从 R 到 Python 的 By 等价物

标签 python r

我是 python 新手。 如果有人能告诉我如何在 python 中使用 by 来包装数据表,我将不胜感激

例如

tmp2=by(data =tmp,tmp$categorie, FUN = function(x) head(x, nb))
tmp2=do.call("rbind",tmp2)

提前致谢,

从评论我完成我的帖子:

 d=d[,c('categorie','titre','permanent')]
 > d
     categorie titre permanent
1          bro Vide-     false
2          bro March     false
3          bro Salon     false
4          bro Puces     false
5          bro Puces     false
6          bro March     false
2158       var   IAM     false
2159       var Valer     false
2160       zoo Aquar      true
2161       zoo Menag      true
2162       zoo Aquar      true
2163       zoo Aquar      true

> (tmp =by(data =d,d$categorie, FUN = function(x) head(x, 2)))
d$categorie: bro
  categorie titre permanent
1       bro Vide-     false
2       bro March     false
------------------------------------------------------------------------------------ 
d$categorie: var
     categorie titre permanent
2158       var   IAM     false
2159       var Valer     false
------------------------------------------------------------------------------------ 
d$categorie: zoo
     categorie titre permanent
2160       zoo Aquar      true
2161       zoo Menag      true
> 
> (tmp2=do.call("rbind",tmp))
         categorie titre permanent
bro.1          bro Vide-     false
bro.2          bro March     false
var.2158       var   IAM     false
var.2159       var Valer     false
zoo.2160       zoo Aquar      true
zoo.2161       zoo Menag      true

最佳答案

给定的 R 代码是 split-apply-combine 范例的示例:

  • 通过类别变量拆分 data.frame
  • 为每个组应用一个函数
  • 将结果合并到一个data.frame中

在 python 中,您可以使用 pandasgroupby 来做同样的事情:

import pandas as pd
d = {'one' : [1., 2., 3., 4.],'two' : [1., 2., 3., 4.], 'group' : [1, 1, 2, 2]}
df = pd.DataFrame(d)
df.groupby(['group']).head(1)

关于python - 从 R 到 Python 的 By 等价物,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21260171/

相关文章:

python - bash : 'command not found' for python, r 和 nano

Python matplotlib 动画重复

r - 将ggplot文本放置在每个角

r - R 包 googleVis 中 gvisTimeline 的自定义工具提示

python - 将列添加到表的左侧 - Python docx

python - 将 Pandas Dataframe 的索引拆分为单独的列

python - GAE 数据存储查看器 - 编辑列表

r - 将NA移到数据框中每一列的末尾

将 R 中的值 "Yes"替换为 1,将 "No"替换为 0

r - 如何使用 ggplot2 制作基本的 R 风格箱线图?