python - 计算Python中两个链接列的频率

标签 python pandas

所以,这是我的问题。我有两列:

level | people
 low  | person1
 low  | person1
 high | person1
 high | person2
medium| person2

我想在另一个单元格中写一个这样的表格:

people |low|medium|high|
person1 | 2 |   0  |  1 |
person2 | 0 |   1  |  1 |

我正在尝试使用 pandas(groupby, value_count...) 和 openpyxl,但没有任何效果,并且无法手动执行此操作,因为它是一个包含一千个值的工作表。请帮忙。

最佳答案

我认为这是pivot_table的一个很好的用途

df.pivot_table(columns='level', index='people', aggfunc='size').fillna(0)

关于python - 计算Python中两个链接列的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53380340/

相关文章:

python - Pandas read_html 导致 TypeError

python - Python 中通过随机化减少文本文件

Python Pandas NLTK 从 Dataframe 'join() argument' 错误的文本字段中提取常用短语 (ngrams)

python - Pandas 中的简单/初学者 Excel 转换

python - 抓取时如何处理 'endless'网页

python - 根据所选列过滤重复的行并与 Pandas 中的另一个数据框进行比较

python - 协议(protocol)错误,得到 "H"作为回复类型字节

python - 如何从 Pandas 数据框中的时间戳列中删除时区

python - 检查日期是否属于 pandas 数据框

python - 如何将多列中的特定值替换为另一个数据帧的相应值?