python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水?有谁知道更好的方法吗?

标签 python twitter hydration

我有一个关于重新整理推文文字的问题。任何帮助,将不胜感激。
这是我的数据来源;关于电晕鸣叫:
source of data set
我从照片中下载了一个数据集(名为2020年2月1日)
photo of my data set
然后,我将过滤这些数据以显示“GB”中仅有的24000条推文
totall number of my tweet id
我使用twarc来填充我的tweet文本,如下所示:
首先,使用pip安装twarc
然后,在命令行中键入:twarc configure然后,内部消费者 key 和 secret key
然后,编写一个命令:

twarc hydrate id.txt > tweet_hydrated.jsonl
但是,我在24000条推文ID中只得到18条推文
all that I could hydrate
我也使用了水化器应用程序,但结果是一样的。我究竟做错了什么?从大量数据中获取18个逻辑是否合乎逻辑?任何有关为tweet文本世界增 hydration 气的新建议都值得赞赏。 (对不起我的英语不好,我不是幼稚的演讲者)

最佳答案

我现在设法重现了这一点,并且我相信在将您的JSON输入转换为CSV/Excel到一系列Tweet ID转换为 hydration 的过程中,您可能正在使用JavaScript(?),并且Tweet ID失去了准确性。提示是当我在Excel列中注意到所有以0000结尾的Tweet ID时。您需要使用一种更精确的方法来将Tweet ID放入twarc。

关于python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水?有谁知道更好的方法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63254995/

相关文章:

php - 使用PHP在Twitter上发布时加剧问题

php - Doctrine -OneToMany关系,所有结果行均未在对象中提取

doctrine - 如何从 Zend Forms 中正确地补充和提取 Doctrine Entity

python - 如何比较 2 "Friends"并查看他们是否在彼此的好友列表中?

python - 在 Python 中将表作为电子邮件正文(而不是附件)发送

php - 提取 Twitter 个人资料图像时的类 ="disconnect-collapsed"

php - 在隔离包中注册 Symfony Hydrators

python - 我怎样才能记住函数中的参数?

python - 如何(正确地)在 AWS Lambda 函数中使用外部凭证?

objective-c - 禁用 Twitter 通用深层链接