python - Pandas 多索引切片 "Level type mismatch"

标签 python pandas slice multi-index

我从 0.13.1 迁移到 pandas 0.17 版,我在切片时遇到了一些新错误。

>>> df
         date  int  data
0  2014-01-01    0     0
1  2014-01-02    1    -1
2  2014-01-03    2    -2
3  2014-01-04    3    -3
4  2014-01-05    4    -4
5  2014-01-06    5    -5
>>> df.set_index("date").ix[datetime.date(2013,12,30):datetime.date(2014,1,3)]
            int  data
date                 
2014-01-01    0     0
2014-01-02    1    -1
2014-01-03    2    -2
>>> df.set_index(["date","int"]).ix[datetime.date(2013,12,30):datetime.date(2014,1,3)]
Traceback (most recent call last):
...
TypeError: Level type mismatch: 2013-12-30

它在 0.13.1 上运行良好,而且它似乎特定于带日期的多索引。 我在这里做错了什么吗?

最佳答案

发生此错误是因为您正尝试对未包含在索引中的日期(标签)进行切片。要解决此级别不匹配错误并返回可能在或可能不在 df multiindex 使用范围内的值:

df.loc[df.index.get_level_values(level = 'date') >= datetime.date(2013,12,30)] 
# You can use a string also i.e. '2013-12-30'

get_level_values() 和比较运算符为索引器设置了 True/False 索引值的掩码。

无论字符串是否在索引中,使用字符串或日期对象进行切片通常在具有单个索引的 Pandas 中有效,但不适用于多索引数据帧。尽管您尝试使用 datetime.date(2013,12,30) : datetime.date(2014,1,3) set_index 调用将索引从 2013-12-30 设置为 2014-01-03,但生成的 df 索引是从 2014-01-01 到 2014-01-03。为包括 2013-12-30 在内的这些日期设置索引的一种正确方法是使用日期时间对象的任一字符串将索引设置为日期范围,例如:

df.set_index("date").loc[pd.date_range('2013-12-30', '2014-12-03')]

关于python - Pandas 多索引切片 "Level type mismatch",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33801584/

相关文章:

go - 在 go 中对一个 uint64 slice 进行排序

python pylibmc 没有安装

python 子进程不适用于 ssh 命令

python - 如何有效地确定给定值所在的区间?

python - 选择列列表中至少一个值不为空的行

python - Pandas/Python 将两列转换为矩阵。矩阵中的列名

python - json_normalize 带有包含字典的列表的 JSON 文件(包括示例)

python - 使用 Pandas Dataframe 选择将哪些列从 MySQL 导出到 Excel

arrays - 使用切片和使用对数组的引用作为参数有什么区别?

Python/numpy棘手的切片问题