wikipedia - 从维基百科中提取人物日期数据

标签 wikipedia dbpedia wikidata date

我正在尝试从维基百科中提取出生和死亡数据。我使用过 DBpedia 和 Wikidata,但在这个特定实例中,日期与 Wikipedia 不匹配。

此查询https://www.wikidata.org/w/api.php?action=wbgetentities&format=json&titles=Thomas_MacDermot&sites=enwiki返回日期为1870-01-01的P569。 DBpedia 显示相同的日期。

维基百科页面 https://en.wikipedia.org/wiki/Thomas_MacDermot 显示日期为 1870 年 6 月 26 日。

为什么会出现这种差异?可以通过编程方式从维基百科本身检索此日期信息(即不是屏幕抓取)吗?

谢谢!

最佳答案

Wikidata用独立输入的结构化数据补充维基百科的大部分非结构化内容,这些数据可能会也可能不会出现在维基百科上。

DBpedia项目将许多结构化和一些非结构化的维基百科内容转换为结构化数据。

DBpedia (更清楚地说,DBpedia 快照)数据通常滞后于维基百科的变化数月至数年。在这里,我们看到dbo:birthDate for Thomas MacDermot as "1870-1-1" .

DBpedia Live数据通常滞后于维基百科的更改几秒到几小时(在这个不断发展的环境中,由于软件、硬件和其他问题,偶尔会有更长的延迟)。在这里,我们看到dbo:birthDate for Thomas MacDermot as "1870-06-26"^^xsd:date .

您可能会找到On the Mutually Beneficial Nature of DBpedia and Wikidata引起兴趣。


P569被描述为“出生日期|出生日期|出生日期|出生年份|出生年份|出生年份|出生日期”——这对我来说非常令人困惑。似乎一些实体在此属性中用完整日期进行描述,而其他实体在此属性中仅用年份进行描述,并且虽然此属性本身被描述为“永不改变”,但维基数据数据已存储的内容可能不正确,因此即使事实没有变化,维基数据中的值也可能会发生变化。

关于wikipedia - 从维基百科中提取人物日期数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58494163/

相关文章:

algorithm - aho corasick 的可扩展性

html - 如何使用带空格的html anchor ?

sparql - 如何按名称一致地查询 dbpedia 中的编程语言?

sparql - 维基数据:如何通过 SPARQL 查询 "language"(P1448) 的 "official name"?

sparql - 获取每个属性的不同值的平均数量

ios - "No Results"当没有人脸出现时(Swift)-简单

python - 区分 Wiki 中的文章页面和列表/消歧页面

sparql - 维基数据中重新定义的 RDF 属性

带圆括号的 sparql 查询抛出异常

sparql - 如何在 DBPedia 中列出所有不同的属性