python - 计算 Pandas 中不均匀的箱子

标签 python pandas

pd.DataFrame({'email':["a@gmail.com", "b@gmail.com", "c@gmail.com", "d@gmail.com", "e@gmail.com",],
                  'one':[88, 99, 11, 44, 33],
                  'two': [80, 80, 85, 80, 70],
                   'three': [50, 60, 70, 80, 20]})

鉴于此 DataFrame，我想为每一列(一、二和三)计算特定范围内的值的数量。

范围例如:0-70、71-80、81-90、91-100

所以结果是:

out = pd.DataFrame({'colname': ["one", "two", "three"],
                   'b0to70': [3, 1, 4],
                   'b71to80': [0, 3, 1],
                   'b81to90': [1, 1, 0],
                   'b91to100': [1, 0, 0]})

执行此操作的惯用方法是什么？

最佳答案

这样就可以了:

out = pd.DataFrame()
for name in ['one','two','three']:
    out[name] = pd.cut(df[name], bins=[0,70,80,90,100]).value_counts()
out.sort_index(inplace=True)

           one  two  three
(0, 70]      3    1      4
(70, 80]     0    3      1
(80, 90]     1    1      0
(90, 100]    1    0      0

关于python - 计算 Pandas 中不均匀的箱子，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47745373/

上一篇：python - 使用scrapy提取所有分页链接到页面？

下一篇：Python for 循环在字符串结束前停止

相关文章：

python - 如何在 Pandas 中制作一个简单的频率表

python - 根据日期列表计算日期时间

python - XML 到 Pandas 数据框

python-3.x - 如何迭代 dfs 并使用组合名称附加数据

python - 神经网络偏差训练

python - 基于 key 分发 Hadoop 流输出文件

python - 如何修复“此 GDB 副本不支持 Python 脚本”

java - Jython 有没有好的 NumPy 克隆？

python - 如何检查每个 pandas 系列值都是唯一的

python - 如何更改打印的 qweb 文件名