python - 在python中按索引绘制字符串数据

标签 python plot distribution categorical-data

我有一个具有以下格式的数据集:

             query_phone         Day   Actor      ObjGrp
0              495393475  2017-09-21   Joana      din
1              676793475  2017-09-21   marta      ver
2              806494953  2017-09-21   joao       hav
3              595243631  2017-09-21   mark       din
4              444709531  2017-09-25   caty       ver
5              447159403  2017-09-25   rodin      tug
6              762976443  2017-09-25   rodin      tug
7              865853581  2017-09-25   john       han
8              441331962  2017-09-25   van        ver
9              261331962  2017-09-25   van        ver
10             455924196  2017-09-25   david      wog

我可以吗,数据框有 80000 行。

我想绘制它的分布。我的意思是绘制一条线,对于每个组合电话、日期、 Actor 和 objgrp 告诉我该实例出现了多少次,这样我就可以分辨出重复的行为。

有人知道怎么做吗?我找到的所有绘图方式,不但不接受字符串类型,也不让我选择y轴作为数量。

谢谢,

最佳答案

这里有讨论Post其中 @DSM 显示如何连接给定列中具有相同值的条目,如原始文章作者所建议:

pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)

假设您将数据作为 pandas 数据框打开。

如果你看看 groupby 函数 documentation您将能够注意到,您可以将这些 iten 按多个列进行分组,如果我正确理解您的问题,将为您返回一个列表,您可以在其中轻松查看重复并研究它们的频率。

关于python - 在python中按索引绘制字符串数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53762331/

相关文章:

r - 在 scatter3d 中显示点标签

R - 更改 corrplot 轴标签的大小

r - 将 rnorm 参数设置为等于向量

c++ - 为什么std::uniform_real_distribution无法生成正确的浮点值?

python - SQL Bigint 到 int64 到时间戳产生错误的日​​期

python - 如何基于 SQLAlchemy 模型生成 WTForm?

python - 在导入模块后的 python 中,有没有办法找到它是从哪个物理文件加载的?

python - 列表、整数和字符串等对象的值存储在哪里?

python - x 坐标范围较大时,matplotlib 中的条形图显示较少的条形图

java - 如何配置 Eclipse 来构建需要外部库的 Java 应用程序?