假设您有一个文档提到“土耳其”和“ Istanbul 尔”,并且您想要提取这些关键字并将其与维基百科文章进行匹配。但对于“turkey”来说,它可能意味着土耳其这个国家或土耳其这个鸟。那么是否可以使用第二个关键字“ Istanbul 尔”来测量它与正确的“土耳其”之间的“距离”。所以:
Istanbul 尔 -> 土耳其国家 -> 关闭。
Istanbul 尔 -> 火鸡鸟 -> 遥远。
进一步解释我对距离的理解:据我了解,SPARQL 可以遍历图形,而 DBPedia 是一种(知识)图形,因此我要查找的距离可能就在图形中。
最佳答案
如果资源之间存在唯一路径,您可以在 SPARQL 中找到两个资源之间的路径长度。 (现在已经在很多地方对此进行了描述;例如, this answer 到 Calculate length of path between nodes? 。)但是,如果有多个路径连接端点,则无法使用该技术,因为它通过计算路径上的节点来工作。 )资源之间,所以如果有多个路径,它不会很有用。
在 DBpedia 中,任何一对资源之间都可能存在大量路径,因此很难使用此类指标。不过,您可以使用的另一种选择是找到最接近的公共(public)父类(super class),并使用基于该父类(super class)的度量。这种方法已在 this answer 中讨论过。至finding common superclass and length of path in class hierarchies .
关于sparql - 使用 SPARQL 和 DBPedia 测量主题之间的距离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21690150/