python - 给定一个值,我怎么知道它出现在哪些列中?

标签 python python-3.x pandas

我有一个包含 4000 列的巨大数据框,我需要查看一个或多个列中是否存在一个值(我需要列名),如何索引 pandas 中的列数和列名?到目前为止,我尝试应用这个想法:

df.index[df.columns] == 'my_val'].tolist()

然而,这只是返回 bool 值,知道如何返回值所在列的名称吗?

最佳答案

我认为需要:

cols = df.columns[(df == 'my_val').any()]

示例:

df = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')})

print (df)
   A  B  C  D  E  F
0  a  4  7  1  5  a
1  b  5  8  3  3  a
2  c  4  9  5  6  a
3  d  5  4  7  9  b
4  e  5  2  1  2  b
5  f  4  3  0  4  b

cols = df.columns[(df == 'a').any()]
print (cols)
Index(['A', 'F'], dtype='object')

解释:

首先按值比较所有DataFrame:

print (df == 'a')
       A      B      C      D      E      F
0   True  False  False  False  False   True
1  False  False  False  False  False   True
2  False  False  False  False  False   True
3  False  False  False  False  False  False
4  False  False  False  False  False  False
5  False  False  False  False  False  False

然后通过 DataFrame.any 过滤每行至少一个 True :

print ((df == 'a').any())
A     True
B    False
C    False
D    False
E    False
F     True
dtype: bool

最后通过 bool 掩码过滤 df.columns:

print (df.columns[(df == 'a').any()])
Index(['A', 'F'], dtype='object')

关于python - 给定一个值,我怎么知道它出现在哪些列中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51402547/

相关文章:

python - 了解聚类中的 np.zeros

python-3.x - 将两个具有相同维度并重复行的不同数据框相乘

python - PYSPARK:如何找到 pyspark 数据框中两列的余弦相似度?

python - 如何以编程方式在 Linux 中查找网络使用情况

python - 如何在 Apache 上使用基本的 Python CGI 脚本处理 POST 请求?

python - 在 Python3 中使用 cookie 处理程序处理站点请求的正确方法是什么?

python - 如何通过 django 上传以通用换行模式打开 csv?

python - 创建一个函数来为上传的图像位置指定目录

python pandas 日期转换为单词

pandas - 根据时间删除行