java - 哪个 rdfa 解析器支持当前使用的 rdfa 属性?

标签 java parsing rdfa

我正在使用 Jena 使用 Java 构建一个应用程序来抓取语义信息。我正在寻找可以让我正确提取所有 RDFa 语句的 RDFa 解析器。具体来说,提取有关所用 namespace 的信息并假定 RDFa 标记在页面中是正确的会生成正确的三元组,即区分对象和数据属性的三元组。

我浏览了网站 http://rdfa.info/wiki/Consume 上的所有 RDFa 解析器对于Java。他们都在努力提取任何 RDFa 语句,如果它们没有崩溃,Jena RDFa 解析器会显示大量错误,然后死得很惨,数据几乎没有用,因为它处理不当并且通常是混淆的。我是这方面的新手,所以请保持温柔:)

我也曾考虑过使用用不同语言编写的库,但又一次我真的不知道如何将它插入 Java 代码。有什么建议吗?

最佳答案

大多数 RDFa 解析器都在处理无效的 HTML。 any23 library包含一个可以处理无效 HTML 的 RDFa 解析器。它将任何 RDFa 解析为完整的 RDF,包括 namespace 映射等,并且正在积极开发中。

关于java - 哪个 rdfa 解析器支持当前使用的 rdfa 属性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2753523/

相关文章:

java - 完美的数字

html - 用语义注释 HTML IMG

schema.org - OpenGraph 还是 Schema.org?

rdf - schema.org 的使用如何符合关联数据原则?

java - 无法从静态上下文引用非静态字段 mFirebaseAnalytics

java - 使用 S/4HANA Cloud SDK 执行 OData 查询时出现 DestinationAccessException >= 2.0.0

java - MQTT - 订阅方法不起作用

c++ - Boost::spirit(经典)基元与自定义解析器

java - 如何使用 org-json 库解析 json?

java - 按顺序阅读 PDFBox 中的段落