api - 从维基百科文章中获取摘录?

标签 api parsing wikipedia wikipedia-api

我一直在Wikipedia API上下,但我不知道是否有一种很好的方法来获取文章的摘录(通常是第一段)。获得该段落的 HTML 格式也很好。

我目前看到的获得类似片段的唯一方法是执行全文搜索( example ),但这并不是我真正想要的(太短了)。

除了粗暴地解析 HTML/WikiText 之外,还有其他方法可以获取维基百科文章的第一段吗?

最佳答案

使用此链接以 xml 形式获取未解析的介绍
“http://en.wikipedia.org/w/api.php?format=xml&action=query&prop=extracts&exsentences=10&titles=Aati kalenja”

早些时候,我可以通过像上面的链接一样添加带有 src 的 iframe 来在单个页面中从一个类别中引入主题/文章列表。但现在 chrome 抛出了这个错误 - “拒绝显示文档,因为 X 禁止显示 -框架选项。”有什么办法吗?请帮助..

关于api - 从维基百科文章中获取摘录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2560264/

相关文章:

python - 如何将 Wikipedia wikitable 转换为 Python Pandas DataFrame?

javascript - 获取 Spotify 用户当前播放的轨道名称 [Web API]

api - 使用通用搜索 api 实时监控 Twitter 主题标签?

objective-c - iPhone App通过LinkedIn API授权后无法确认

c# - 使用 HtmlAgilityPack 将 HTML 字符串分成两部分

ruby - 在 Ruby 中循环匹配文本

java - Groovy 脚本无法正确解析 XML

mysql - 尝试将数据导入 mySql 时找不到 frm 文件

javascript - 如何在 Mediawiki 中启用站点的移动 View ?

java - 如何将图像发送到 GCP Vision API