python - 检查 pandas 字符串列是否包含多个单词(按任意顺序)

标签 python regex pandas string-matching

我正在处理 Twitter 数据并尝试查找包含多个单词的字符串。 下面一行适用于一个单词并使用 OR 条件。

tweets_text[tweets_text.str.contains("break")] #Find strings with the word break

tweets_text[tweets_text.str.contains("break|social|media")] #Find strings with either break or social, or media

我正在尝试查找包含这三个单词的字符串(“break & Social & media”)

最佳答案

df = pd.Series(['break', 'break media social', 'break media'])

系列:

0                 break
1    break media social
2           break media

提取:

tweets_text[tweets_text.str.contains('(?=.*break)(?=.*social)(?=.*media)')]

输出:

1    break media social

关于python - 检查 pandas 字符串列是否包含多个单词(按任意顺序),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68016964/

相关文章:

python - 发送不改变用户当前页面的 HTTP 响应

regex - bash:正则表达式提取

regex - 使用 URL 参数 ID 编号范围进行 HTACCESS 重定向

python - 通过匹配 Pandas DataFrame 中另一列中的值来获得行值的差异

python - 比较列 pandas python

python - 在词典列表中搜索特定词典的位置

python - 如何将信号对话框连接到PyQt5插槽

python - 合并数据帧并仅保留不匹配的条目

c# - .* 在正则表达式中做什么?

python - 如何重新排序数据框字段?