python - 将 Python 正则表达式用于 Twitter 数据

标签 python regex twitter

我在我的应用程序中过滤推文,并希望返回文本中包含特定单词的所有推文。因此,如果我正在过滤 BBC 并且我想要 BBC 的所有实例,例如。 BBC、bbc、BBC1、#BBC、@bbc,我怎么能写正则表达式。

到目前为止我在做:

re.compile(r'#|@[0-9]'+term, re.IGNORECASE)

Term 是一个包含单词的列表,我只想返回列表中带有额外的 @ 或 # 或 0-9 前缀或附加该单词​​或单词本身的那些单词。

谢谢

最佳答案

使用 '\b' 分隔符查找整个单词:

re.compile(r'\b(?:#|@|)[0-9]*%s[0-9]*\b' % re.escape(term), re.IGNORECASE)

关于python - 将 Python 正则表达式用于 Twitter 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13425584/

相关文章:

python - 类型错误:列表索引必须是整数,而不是列表。怎么修?

python - 如何将本地 PyCharm 连接到服务器上安装的 python?这可能吗?

ios - Twitter 登录问题 Parse.com iOS

javascript - 无法分享包含引用和作者的推文(FCC 随机引用机)

twitter - oauth 推特和电子邮件

python - 如何在 Python 中使用 PIL 将图像合成到另一个图像上?

python - python中嵌套列表的意外行为

javascript - 可以以 0 开头的数字的正则表达式

javascript - 正则表达式改进

javascript - 如何限制 AngularJS 中的文本字段符号?