我有一个具有以下格式的数据集:
query_phone Day Actor ObjGrp
0 495393475 2017-09-21 Joana din
1 676793475 2017-09-21 marta ver
2 806494953 2017-09-21 joao hav
3 595243631 2017-09-21 mark din
4 444709531 2017-09-25 caty ver
5 447159403 2017-09-25 rodin tug
6 762976443 2017-09-25 rodin tug
7 865853581 2017-09-25 john han
8 441331962 2017-09-25 van ver
9 261331962 2017-09-25 van ver
10 455924196 2017-09-25 david wog
我可以吗,数据框有 80000 行。
我想绘制它的分布。我的意思是绘制一条线,对于每个组合电话、日期、 Actor 和 objgrp 告诉我该实例出现了多少次,这样我就可以分辨出重复的行为。
有人知道怎么做吗?我找到的所有绘图方式,不但不接受字符串类型,也不让我选择y轴作为数量。
谢谢,
最佳答案
这里有讨论Post其中 @DSM 显示如何连接给定列中具有相同值的条目,如原始文章作者所建议:
pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)
假设您将数据作为 pandas 数据框打开。
如果你看看 groupby 函数 documentation您将能够注意到,您可以将这些 iten 按多个列进行分组,如果我正确理解您的问题,将为您返回一个列表,您可以在其中轻松查看重复并研究它们的频率。
关于python - 在python中按索引绘制字符串数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53762331/