我尝试使用 SQL 查询访问 WikiMedia 数据库以获取文章页面的内容。('old_text', from the 'text' table)
通过搜索其 page_title (来自“页”表)
。
不幸的是,我没有看到 page_id (来自页表)和 old_id(来自“文本”表)之间的映射
。
那么,如何使用给定的页面标题从带有 sql 查询的文章中获取文本?
最佳答案
为了补充 svick 的回答,这里有一个实际的示例 SQL 查询:
SELECT old_text, old_flags
FROM page
JOIN revision ON rev_id = page_latest
JOIN text ON old_id = rev_text_id
WHERE page_title = 'Main_Page' AND page_namespace = 0;
(请注意,您还需要 old_flags
字段来理解 old_text
的内容。至少,您应该检查 flags 字段是否包含您期望它具有的值。)
关于mysql - 从 page_title 映射到 old_text 内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12388635/