wikipedia - 如何知道来自 API 的维基百科内容是否包含有用的文章或不明确的文章

标签 wikipedia wikipedia-api

我可以获取 XML 或任何其他格式的维基百科文章。但是对于一个术语,我想首先知道返回的文本是包含完整的文章还是仅仅包含像输入的那样的含糊不清的术语。

所以“SEO”是一个模棱两可的(或重定向)术语,但如何从结果中知道这一点?
而“纽约”返回完整的文章。

编辑

我的简单问题是,我有 400 个城市名称,我想要使用 API 来获取它的维基百科内容,我不想要那些不是城市文章但只包含一些重定向或其他含糊不清的术语的页面。我想丢弃那些。

最佳答案

所有消歧义页面都在恰当命名的类别 All disambiguation pages 中,因此您可以检查该类别。

作为替代方案,您可以检查 Disambiguation 是否存在模板,或 one of its variants和他们的重定向。

关于wikipedia - 如何知道来自 API 的维基百科内容是否包含有用的文章或不明确的文章,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9684314/

相关文章:

java - NLP使用维基百科(java编程)

javascript - api调用后如何获取对象数据?

algorithm - aho corasick 的可扩展性

python - 使用 pywikipedia 登录并访问 wikipedia API

python - 维基数据查询服务 - 获取页面的创建日期

java - 将维基百科页面的内容获取到 Android

3d - 关于 3D 投影的问题?

解析维基百科国家、地区、城市

javascript - 如何使用维基百科 API 在浏览器 javascript 上编辑页面?

javascript - 维基百科 (API) "List_of"页面内容 - 解析为 JSON