sparql - Jena:如何推断数据/性能问题

标签 sparql jena ontology inference protege

我想使用 Jena 的推理功能,但在使用 InfModel 时遇到了一些性能问题。

这是我的本体的简化概述:

特性:

hasX            (Ranges(intersection): X, inverse properties: isXOf)
|-- hasSpecialX (Ranges(intersection): X, inverse properties: isSpecialXOf)

isXOf           (Domains(intersection): X, inverse properties: hasX)
|--isSpecialXOf (Domains(intersection): X, inverse properties: hasSpecialX)

此外,还有一个“对象”类:
Object hasSpecialX some X

显式存储的是以下数据:
SomeObject a Object 
SomeX a X
SomeObject hasSpecialX SomeX  

使用以下查询,我想确定一个实例属于哪个类。根据所做的假设,只应返回“SomeObject”。
SELECT ?x WHERE { ?x :hasX :SomeX . } 

但是,查询 ds.getDefaultModel()不起作用,因为数据没有明确存储。当我使用时 infModel另一方面,查询永远不会完成。在中止之前,我最长等待了 25 分钟。 (triplestore 的大小约为 180 MB)

这是我的代码:
OntModel ont = ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM_MICRO_RULE_INF, null); 
ont.read("file:..." , "RDF/XML"); 

Reasoner reasoner = ReasonerRegistry.getOWLMicroReasoner(); 
reasoner = reasoner.bindSchema(ont); 

Dataset dataset = TDBFactory.createDataset(...); 
Model model = dataset.getDefaultModel(); 

InfModel infModel = ModelFactory.createInfModel(reasoner, model);

QueryExecution qe = null;
ResultSet rs;

try {
    String qry = "SELECT ?x WHERE { ?x :hasX :SomeX . }"; 
    qe = QueryExecutionFactory.create(qry, infModel); 
    rs = qe.execSelect(); 

    while(rs.hasNext()) {
        QuerySolution sol = rs.nextSolution(); 
        System.out.println(sol.get("x"));
    }
} finally {
    qe.close();
    infModel.close();
    model.close(); 
    dataset.close();
}

上面的代码有什么问题吗,或者还有什么可能是它不起作用的原因?

除此之外,我想知道如果我执行“将推断的公理导出为本体”(由 Protege 提供)是否可以提高性能?

编辑:
我同时尝试使用 Pellet,但仍然无法获得推断模型,正如我在其他问题中所述:OutOfMemoryError using Pellet as Reasoner .那我还能做什么?

最佳答案

关于性能,最好在断言数据之前进行推理,而不是在关闭 Jena 推理机制的情况下进行 SPARQL。您已经在使用 TDB,它是用于大型数据集的合适 Jena 组件。

如果直接使用推断数据没有获得预期的性能,那么我建议转向更具可扩展性的三元组存储( 4storeVirtuoso )。

关于sparql - Jena:如何推断数据/性能问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10181183/

相关文章:

java - 如何使用 SPARQL 查询 SUMO 本体

java - 在 Virtuoso 服务上使用 Jena 的 SPARQL 查询执行时间

semantics - OWL 双关语是否将同名的类和个体在语义上视为“相同”?

java - 使用 Jena API 读取猫头鹰文件

SPARQL CONCAT() 和 STR() 与 CONSTRUCT

Sparql:变量之间的算术运算符?

java - JENA:初始化 HSQLDB RDF 数据存储

xml - RDF Schema - 如何创建实例?

sparql - 加入 SPARQL 查询

rdf - 在 apache jena SPARQL 中使用 GROUP BY、COUNT 和 SAMPLE