python - 在python中按索引绘制字符串数据

标签 python plot distribution categorical-data

我有一个具有以下格式的数据集:

             query_phone         Day   Actor      ObjGrp
0              495393475  2017-09-21   Joana      din
1              676793475  2017-09-21   marta      ver
2              806494953  2017-09-21   joao       hav
3              595243631  2017-09-21   mark       din
4              444709531  2017-09-25   caty       ver
5              447159403  2017-09-25   rodin      tug
6              762976443  2017-09-25   rodin      tug
7              865853581  2017-09-25   john       han
8              441331962  2017-09-25   van        ver
9              261331962  2017-09-25   van        ver
10             455924196  2017-09-25   david      wog

我可以吗，数据框有 80000 行。

我想绘制它的分布。我的意思是绘制一条线，对于每个组合电话、日期、 Actor 和 objgrp 告诉我该实例出现了多少次，这样我就可以分辨出重复的行为。

有人知道怎么做吗？我找到的所有绘图方式，不但不接受字符串类型，也不让我选择y轴作为数量。

谢谢，

最佳答案

这里有讨论Post其中 @DSM 显示如何连接给定列中具有相同值的条目，如原始文章作者所建议:

pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)

假设您将数据作为 pandas 数据框打开。

如果你看看 groupby 函数 documentation您将能够注意到，您可以将这些 iten 按多个列进行分组，如果我正确理解您的问题，将为您返回一个列表，您可以在其中轻松查看重复并研究它们的频率。

关于python - 在python中按索引绘制字符串数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53762331/

上一篇：python - 尝试删除文件中的最后一个字符但不起作用

下一篇：python - BashOperator 为其他 PythonOperators 中使用的库引发 ImportError

相关文章：

r - 在 scatter3d 中显示点标签

R - 更改 corrplot 轴标签的大小

r - 将 rnorm 参数设置为等于向量

c++ - 为什么std::uniform_real_distribution无法生成正确的浮点值？

python - SQL Bigint 到 int64 到时间戳产生错误的日期

python - 如何基于 SQLAlchemy 模型生成 WTForm？

python - 在导入模块后的 python 中，有没有办法找到它是从哪个物理文件加载的？

python - 列表、整数和字符串等对象的值存储在哪里？

python - x 坐标范围较大时，matplotlib 中的条形图显示较少的条形图

java - 如何配置 Eclipse 来构建需要外部库的 Java 应用程序？