python - 获取维基百科文章的当前状态?

标签 python mysql wikipedia milestone

我正在使用 Python 和 MySQL 查询 mediawiki 数据库以获取文章的当前状态(即文章是否为 FA、GA、GAN 等),但无法这样做。

我知道当前状态存储在文本表的 old_text 字段中。我正在尝试类似的事情:

loc = select (locate('currentstatus', old_text))
query = ('select substring(old_text, '%s', 20) from wikidb where page_id = 1234' % (loc))

但不幸的是 loc 给出了第一次出现的 currentstatus 而不是最后一次出现,因为最新/最新状态在底部。

我不确定如何修复它或者我是否使用了正确的方法。

最佳答案

对于维基百科,更重要的是检查文章所属的类别。或者如果处理原始维基文本,寻找相应的模板:

  • 特色文章 (FA) 在 [[category:Featured articles]] 中并使用 {{featured article}},它引用 [[template:featured article]]
  • 好文章 (GA) 在 [[category:Good articles]] 中并使用 {{good article}},它引用了 [[template:good article]]

这两个类别都是隐藏的,因此您必须启用显示隐藏类别的首选项,或者遍历类别内容以查看文章是否存在。

其他文章类别(A、B、C、FL、Start、Stub、List、undefined)在相应的讨论页上使用一个或多个 WikiProject 模板进行评估。没有标准。

关于python - 获取维基百科文章的当前状态?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6600693/

相关文章:

python - 如何计算一个 df.column 的时间值是另一 df.column 的一部分?

python - 在 Pandas 循环中合并多个系列

mysql/工作台 : why is on update CURRENT_TIMESTAMP added for not null timestamp

c# - 维基链接 - 将文本 [[a]] 变成内部链接

sparql - Wikidata api如何根据维基百科页面id获取一些属性

python-3.x - 有选择地使用 Python 抓取维基百科表格

php - Python 等价于 PHP include

python - 使用 Python 使用 JSON 或 pickle 编码为变量

php - 在 PDO/MySQL 中获取同一行的下一列的下一个元素?

php - 上传PHP Mysql时重命名图片