我有一个 pandas 数据框,如下所示。它有大约一百万行。
name = ['Jake','Matt', 'Henry']
0 A
1 Jake Hill
2 Matt Dawn
3 Matt King
4 White Henry
5 Hyde Jake
我想遍历列表和 df['A'] 列并只返回名字。例如,最终的数据框应该是这样的。
0 A
1 Jake
2 Matt
3 Matt
4 Henry
5 Jake
提前致谢。我是 python 的新手,所以仍在寻找最简单的方法来做到这一点。
最佳答案
您有一个要匹配的名称列表,以及要检查的一系列名称。在此处使用带 str.extract
的正则表达式。
df.A.str.extract(r'({})'.format('|'.join(name)))
0
0 Jake
1 Matt
2 Matt
3 Henry
4 Jake
关于python - 从 pandas df 列的预设字符串列表中拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53386763/