我正在处理 Twitter 数据并尝试查找包含多个单词的字符串。 下面一行适用于一个单词并使用 OR 条件。
tweets_text[tweets_text.str.contains("break")] #Find strings with the word break
tweets_text[tweets_text.str.contains("break|social|media")] #Find strings with either break or social, or media
我正在尝试查找包含这三个单词的字符串(“break & Social & media”)
最佳答案
df = pd.Series(['break', 'break media social', 'break media'])
系列:
0 break
1 break media social
2 break media
提取:
tweets_text[tweets_text.str.contains('(?=.*break)(?=.*social)(?=.*media)')]
输出:
1 break media social
关于python - 检查 pandas 字符串列是否包含多个单词(按任意顺序),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68016964/