mysql - 从 page_title 映射到 old_text 内容

标签 mysql mediawiki

我尝试使用 SQL 查询访问 WikiMedia 数据库以获取文章页面的内容。('old_text', from the 'text' table) 通过搜索其 page_title (来自“页”表)。 不幸的是,我没有看到 page_id (来自页表)和 old_id(来自“文本”表)之间的映射
那么,如何使用给定的页面标题从带有 sql 查询的文章中获取文本?

最佳答案

为了补充 svick 的回答,这里有一个实际的示例 SQL 查询:

SELECT old_text, old_flags
FROM page
  JOIN revision ON rev_id = page_latest
  JOIN text ON old_id = rev_text_id
WHERE page_title = 'Main_Page' AND page_namespace = 0;

(请注意,您还需要 old_flags 字段来理解 old_text 的内容。至少,您应该检查 flags 字段是否包含您期望它具有的值。)

关于mysql - 从 page_title 映射到 old_text 内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12388635/

相关文章:

php - 存储内容,例如 MediaWiki 中的页面

mysql - SQL:发货/发票地址和 SELECT CONCAT 问题的表设计

php - realpath 返回空字符串

从 MySQL 数据库引入之前的 PHP preg_replace 字段

mysql - 如何从 MySQL 服务器建立 SSH 隧道

mediawiki - 维基百科 Api 获取单词量

python - 如何将 mediawiki 中的所有页面导出到单独的页面文件中?

api - 使用维基百科 API 获取图像 URL,但有些图像不返回 URL,为什么?

mysql - 使用 HikariCP 理解和修复 "CommunicationsException: Communications link failure."

php - 从表中选择 group by where date>date in mysql table