python - 在 Twitter API 中使用正则表达式

标签 python regex twitter tweepy

我在 Python 中使用 Tweepy 库来搜索推文。我想知道是否可以使用正则表达式来搜索推文。

我正在使用以下代码:

query = 'ARNOLD or SYLVESTER'     
for tweet in tweepy.Cursor(api.search,
                            query,
                            count=100,
                            result_type="recent",
                            include_entities=True,
                            lang="en").items():

例如,我是否可以搜索所有使用“ARNOLD”或“SYLVESTER”(全部大写/单个单词)的推文并忽略所有其他推文。

我目前正在获取所有由 Arnold 或 Sylvester 组成的推文后处理推文,然后检查所有字符是否均为大写。我想知道是否可以通过 API 搜索本身来完成。

谢谢

最佳答案

不幸的是,Twitter 不支持使用正则表达式搜索推文,这意味着您必须发布流程。实际上,Twitter 上没有任何官方文档说明这一点,但是 everyone谁使用 Twitter 搜索 API post-processes their tweets使用正则表达式(包括我)。由于没有明确的官方立场,我在搜索查询中尝试了几乎所有的正则表达式,但我没有运气。根据 Twitter search API documentation , 查询必须是:

A UTF-8, URL-encoded search query of 1,000 characters maximum, including operators. Queries may additionally be limited by complexity.

所有查询都是 UTF-8 并且显然是这样搜索的。如果有一个我们可以在 API 搜索调用中指定的正则表达式参数就好了,但没有。

这背后的原因可能是对所有推文运行正则表达式搜索会给 Twitter 本身带来额外的处理成本。

关于python - 在 Twitter API 中使用正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23363940/

相关文章:

c# - 如何从这个字符串中获取日期?

Android:使用 Fabric、Twitter REST API 和 Retrofit 将图像添加到推文

python - Django Twitter OAuth 身份验证

python - 如何用不同的表达式格式化原始字符串?

Python - 准确显示 MySQL 数据库中的数据

python - 重新索引特定级别的 pandas MultiIndex

c# - 正则表达式获取我的文件的父目录在字符串文件路径中

python - 做ILP时的多种解决方案

c++ - 在 Eclipse 中将 Boost 链接到我的 C++ 项目

javascript - 遍历对象数组以提取特定数据