node.js - 维基百科 API 信息框

标签 node.js wikipedia-api

我正在使用维基百科 API 从某些页面获取信息框。 一个例子是 Imperial College London 我的问题是我得到的 HESA 学生人数|INSTID=0132 值。我本来希望只得到学生人数,但我得到的是上面的 id。如何获取页面中信息框的值?

此外,如果您检查 wiki page有两个信息框(主信息框和排名信息框)。我怎样才能同时获得它们?

最佳答案

还有一个替代方案 REST API您可以用来访问维基百科内容。要获取您请求的文章的结构良好的 HTML:

https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London

HTML 由 Parsoid 生成生成 HTML/RDFa 内容的服务 DOM Spec 。收件箱将是带有“infobox”类的 html table 元素,因此您可以轻松找到页面上的所有收件箱。

收件箱通常由复杂的模板创建,因此您只需解析表格 HTML 可能会更容易。

关于node.js - 维基百科 API 信息框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36461360/

相关文章:

node.js - 如何使用 Node.js 和 Express 进行\r\n 回车/换行

javascript - 如何将 EJS 模板转换为字符串?

javascript - Mongoose 从查询中设置局部变量

redirect - 如何在不知道所有字符的确切大小写的情况下使 Wikipedia API 规范化和重定向?

MediaWiki API : How to get an article's list of editors

javascript - Karma 无法在 Windows 上启动 PhantomJS - 错误 : spawn UNKNOWN

javascript - 如何在Windows上构建VSCode?

php - 如何只获取维基百科文章的已解析信息框?

postgresql - 每篇维基百科文章的受欢迎程度

wikipedia - 如何从维基百科获取搜索结果