我使用 read_excel()
将 xlsx 电子表格转换为数据框。它通常工作正常,但对于此电子表格,当我导入它并尝试使用 df["Date"] 列出所有值时,它似乎会多次重复每个日期。知道这是为什么吗?
df = pd.read_excel("data.xlsx", sheet_name="Data")
dates = df['Date']
结果:
0 2014-12-22
1 2014-12-22
2 2014-12-22
3 2014-12-22
4 2014-12-22
...
419532 2020-01-10
419533 2020-01-10
419534 2020-01-10
419535 2020-01-10
419536 2020-01-10
编辑:电子表格的一些内容:
最佳答案
pd.read_excel()
将读取整个工作表,除非您将其限制在有限范围内。 Excel 有许多函数可以更改工作表的显示,而无需更改工作表中存在的数据(过滤、隐藏行等)。因此,额外的行是工作表中存在但已隐藏的数据。腹肌
一些明显的迹象是过滤器按钮中是否包含过滤符号、蓝色行号和隐藏行,如下所示。
检查以确保您可以看到所有数据,以便了解工作表中的内容而不是仅可见的内容。
要获得与您拥有的相同的 View ,您可以使用条件过滤数据框。
df = df[df['city'] == 'CALGARY']
或多个条件:
df = df[(df['city'] == 'CALGARY') & (df['utility'] == 'Suncor')]
关于python - 使用 read_excel 时,Pandas 不断重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59709941/