我正在使用维基百科 API 从某些页面获取信息框。
一个例子是 Imperial College London
我的问题是我得到的 HESA 学生人数|INSTID=0132
值。我本来希望只得到学生人数,但我得到的是上面的 id。如何获取页面中信息框的值?
此外,如果您检查 wiki page有两个信息框(主信息框和排名信息框)。我怎样才能同时获得它们?
最佳答案
还有一个替代方案 REST API您可以用来访问维基百科内容。要获取您请求的文章的结构良好的 HTML:
https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London
HTML 由 Parsoid 生成生成 HTML/RDFa 内容的服务 DOM Spec 。收件箱将是带有“infobox”类的 html table
元素,因此您可以轻松找到页面上的所有收件箱。
收件箱通常由复杂的模板创建,因此您只需解析表格 HTML 可能会更容易。
关于node.js - 维基百科 API 信息框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36461360/