python - 字符串 "contains"- Pandas MultiIndex 上的切片

标签 python pandas

如何按 MultiIndex 的字符串内容对其进行切片? IE。该特定索引是否包含特定字符串?

In [12]: df = pd.DataFrame({'a': ['a', 'ab', 'b'], 
                   'c': ['d', 'd', 'd'], 
                   'val': [1, 2 , 3]}).set_index(['a', 'c'])

In [13]: df

Out[13]:

val
a   c   
a   d   1
ab  d   2
b   d   3

In [15]: df.xs('a', level='a', drop_level=False)

Out[15]:

val
a   c   
a   d   1

In[16]: df.xs(contains('a'), level='a', drop_level=False)

预期输出:

Out[16]: 

a   c   
a   d   1
ab  d   2

显然最后一点是不可能的。

  • 如何才能优雅地做到这一点?
  • 你能以某种方式做到不区分大小写吗?

最佳答案

使用boolean indexingget_level_valuesstr.contains :

print (df.index.get_level_values('a'))
Index(['a', 'ab', 'b'], dtype='object', name='a'

print (df.index.get_level_values('a').str.contains('a'))
[ True  True False]

df1 = df[df.index.get_level_values('a').str.contains('a', case=False)]
print (df1)
      val
a  c     
a  d    1
ab d    2

关于python - 字符串 "contains"- Pandas MultiIndex 上的切片,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44097881/

相关文章:

Python 2.7 os.EX_SOFTWARE 未找到

城市和州或国家/地区的 Python 当前时间

python - Python 中基于字典的文本分类

python - 如何在Python中将整个数据集中的值绘制为x轴刻度的子df

python - 获取 pandas 中多个数据帧的每个第 n 个元素

python - 更快的遍历像素的方法

python - 具有相同行数的两个 CSV 文件按列串联

python - append 到列表仅 append 第一项

python - 替换数据框中的值

python - 加速 Pandas to_sql()?