我有一个包含重复条目的 pandas 数据框,我想使用 seaborn
创建一个 tsplot
。我在数据帧上调用 drop_duplicates
(甚至调用 reset_index()
),但是当我必须做绘图时,我仍然得到
ValueError: Index contains duplicate entries, cannot reshape
drop_duplicates
无法解决此问题是否有原因?
编辑我什至通过在放置后对数据帧调用duplicated
进行检查,并且所有行都显示False
。正如我所期望的。
我意识到这里没什么可说的,我只是想看看是否有一些直观的东西我错过了。将尝试创建一个小示例在此处显示,但我的数据集相当大
最佳答案
drop_duplicates
不适用于索引,但适用于数据帧中的值! (因此它查找重复的行,而不是重复的索引)。
但是您在索引上也有相同的功能(请参阅 doc ):
df.index.drop_duplicates()
使用生成的索引,您可以重新索引。
另一种选择是将索引添加为列,并在该列上使用 DataFrame.drop_duplicates
。
另一种选择是使用 groupby:df.groupby(level=0).first()
(并且您可以根据您想要对重复行执行的操作调整 first
)
关于python - 调用 drop_duplicates 后索引包含重复条目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27305451/