java - 计算语句之间的距离

标签 java sparql jena dbpedia

是否可以计算 SPARQL 或 Jena 中两个语句之间的距离?例如,是否可以计算以下之间的距离:

immanuel_kant dbprop:birthPlace Germany
John_Lock     dbprop:birthPlace England

最佳答案

很难准确说出您要计算的内容(因为我们还没有被告知),但听起来您将能够在 SPARQL 中执行此操作。以下查询首先计算哲学家对的相似性度量并将其绑定(bind)到 ?initialSimilarity。这只是他们名字长度的比例。这不是一个特别好的相似性度量,但你说你已经定义了其中一些(评论中提到的 0.60)。然后查询检索两位哲学家的出生地。如果它们相同,则将 0.05 添加到相似性度量中,或者如果它们不同,则减去 0.05,并且该值绑定(bind)到 ?finalSimilarity。 (请注意,个体的birthPlace属性可能有多个值,因此您会看到同一对哲学家出现n×m次,其中n em> 是一个人拥有的出生地数量,m 是另一个人拥有的出生地数量。你可以在这里成对分组,然后取最终相似度的平均值,或者你可以采取一些措施来解决这个问题多个陈述,例如,为每个陈述抽取一个有代表性的出生地。)

select ?name1 ?name2 ?bp1 ?bp2 ?initialSimilarity ?finalSimilarity where { 
  dbpedia-owl:Philosopher ^a ?phil1, ?phil2 .
  ?phil1 rdfs:label ?name1 .
  ?phil2 rdfs:label ?name2 .
  filter( langMatches(lang(?name1),"en") && langMatches(lang(?name2),"en"))

  bind ( strlen(?name1) as ?len1 )
  bind ( strlen(?name2) as ?len2 )
  bind ( if(?len1 < ?len2, ?len1, ?len2) as ?minLen )
  bind ( if(?len1 < ?len2, ?len2, ?len1) as ?maxLen )
  bind ( ?minLen/xsd:double(?maxLen) as ?initialSimilarity )

  ?phil1 dbpedia-owl:birthPlace ?bp1 .
  ?phil2 dbpedia-owl:birthPlace ?bp2 .
  bind ( if( ?bp1 = ?bp2, ?initialSimilarity + .05, ?initialSimilarity - .05) as ?finalSimilarity )
}
limit 10

SPARQL Results

根据评论中的说明,计算您的初始相似度指标并不难,您将其定义为共同类别的数量除以个人拥有的类别的数量总共。这可以通过如下查询来完成:

select ?philosopher1
       ?philosopher2
       (count(distinct ?commonType) as ?intersection)
       (count(distinct ?eitherType) as ?union)
       (count(distinct ?commonType)/xsd:double(count(distinct ?eitherType)) as ?similarity)
where {
  dbpedia-owl:Philosopher ^a ?philosopher1, ?philosopher2 .
  filter( ?philosopher1 != ?philosopher2 )
  ?commonType ^a ?philosopher1, ?philosopher2 .
  { ?eitherType ^a ?philosopher1 } UNION
  { ?eitherType ^a ?philosopher2 } 
}
group by ?philosopher1 ?philosopher2 
limit 3

SPARQL results

产生如下结果:

philosopher1                                  philosopher2                                    intersection  union similarity
http://dbpedia.org/resource/Bawa_Muhaiyaddeen http://dbpedia.org/resource/Abdolkarim_Soroush  6             34    0.176471
http://dbpedia.org/resource/Eric_Voegelin     http://dbpedia.org/resource/Abdolkarim_Soroush  6             30    0.2
http://dbpedia.org/resource/Eric_Ormsby       http://dbpedia.org/resource/%C3%89mile_Meyerson 18            24    0.75

您需要做的就是使用像第一个查询一样的查询来另外选择哲学家的出生地,然后执行您用来计算相似度的任何公式以获得相似度修饰符,然后您可以修改相似度值。

关于java - 计算语句之间的距离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19249119/

相关文章:

Maven:强制 Jersey 使用特定的 Artifact 版本

java - org.apache.http.client. Fluent 损坏 URL

java - 复选框 switch case 的实现

java - 使用不同程序但具有不同结果的相同 Sparql

java - 使用 sparql 查询 Jena 从 OWL 文件中检索个体

java - 使用 Jena 库编写 owl 文件

java - Solr 错误实例化类 : Custom Class

java - 在 JScrollPane 中显示对象 ArrayList 中的变量

SPARQL:拥有女市长的最大城市

sparql - 物联网中的语义技术