我想使用维基 API 获取所选单词的含义。 内容检索数据应与“每日一语”中呈现的相同,只有基本含义,没有词源、同义词等。 例如
"后缀 n 戴在头上或脸上的任何假发,例如假 mustache 或假发。”
我尝试使用文档,但我可以找到类似的示例,有人可以帮助解决这个问题吗?
最佳答案
虽然 MediaWiki 有一个 API (api.php
),但对于您的目的来说,使用 action=raw
参数到 index.php 可能是最简单的
如果您只想检索一个修订版的源代码(不包含在 XML、JSON 等中,而不是 API)。
例如,这是 11 月 14 日当天页面的原始词:
http://en.wiktionary.org/w/index.php?title=Wiktionary:Word_of_the_day/November_14&action=raw
不幸的是,wiki 页面的格式侧重于表示(对于人类读者)而不是语义(对于机器),因此没有“获取词定义”API 命令您应该不会感到惊讶。相反,您的脚本必须能够理解 Wiktionary 编辑器创建和使用的大量文本格式模板,以及复杂的表示格式语法,包括标题、无序列表等。例如,这里是页面“溢出”的源代码:
http://en.wiktionary.org/w/index.php?title=overflow&action=raw
API 中有一个“生成 XML 解析树”选项,但它不会将大部分表示格式分解为 XML。自己看看吧:
如果您想知道是否存在除 MediaWiki 之外的 MediaWiki 格式页面的解析器,不,没有。至少目前维护的任何用 JavaScript 编写的东西都没有(参见 list of alternative parsers ,并检查两个列出的网站)。即便如此,支持大多数/所有通用模板也将是一个巨大的挑战。祝你好运。
关于javascript - 维基百科 API - 词义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4175533/