metadata - 获取维基数据项目查看次数/受欢迎程度指数

标签 metadata sparql wikidata wikimedia wikidata-api

这是我的 SPARQL 查询,用于列出数学家及其维基百科链接和图像:

SELECT DISTINCT ?pers ?persLabel ?nameLabel ?persDescription ?link ?img
WHERE {
  ?pers wdt:P31 wd:Q5.
  {?pers wdt:P101* wd:Q395} union {?pers wdt:P106* wd:Q170790}.
  ?pers wdt:P734 ?name.
  optional {?link schema:about ?pers; schema:isPartOf <https://en.wikipedia.org/>. }
  optional {?pers wdt:P18 ?img. }
  
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
limit 100

现在我接下来想要的是使用某种流行度指数按最著名/流行的条目过滤列表。在 Wikimedia Action API 查询中,我将使用页面查看计数属性来获取一段时间内(例如 60 天)的平均查看次数,从而估算出文章的用户受欢迎程度,例如

https://www.mediawiki.org/w/api.php?action=query&generator=allpages&gaplimit=max&gapfilterredir=nonredirects&gapfrom=a&prop=pageviews

但我不知道维基数据是否也存在这样的指标,或者是否有任何其他索引可用于此目的。

最佳答案

页面浏览量会被记录,在任何项目 View 上单击左侧导航栏中的页面信息时都会显示。这些号码也可用 in this tool而且,我敢打赌,还有 API。事实上,只需将示例 URL 中的主机名更改为 Wikidata works .

但是,如果您想要/需要查询界面中的数据,这并没有多大帮助。为此,我建议使用不同的“流行度”代理。一个常见的问题是包含有关该主题的文章或“附加链接”的语言版本的数量。以下是其工作原理:

[... your query as before ...]
    SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }

    ?pers wikibase:sitelinks ?sitelinks.
}  order by desc(?sitelinks)

或者,您可以尝试出版物的数量:

    ?publication wd:P50 ?pers.
} GROUP BY ?pers ORDER BY desc(COUNT(?publication))

...但恐怕维基数据还不够完整,不够可靠,特别是因为许多科学论文与其作者没有正确链接。

关于metadata - 获取维基数据项目查看次数/受欢迎程度指数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68569972/

相关文章:

image - kCGImagePropertyIPTCKeywords问题

php - PHP 中的 Linux 文件夹标识或元数据

php - 如何使用 PHP 从 JPEG 中获取 'title' 和 'tags' exif 数据

sparql - 使用 SPARQL 提取 dbpedia 实体的层次结构

metadata - 为 Alfresco 中上传的内容添加属性

python - 第一次调用 openrdf-sesame 更新端点非常慢。有没有办法优化它?

sparql - 维基数据 Sparql : how to get a list of actors that where never directed by a given person?

wikidata - Openrefine 和 wikidata : how to get values (not reconciliation)

wikidata - 如何获取所有维基数据属性的列表?