我有一些RDF文件要导入到tripplestore(AllegroGraph)中,但是在第一个文件中,我收到了SAX解析器错误,并指出有无法识别的字符。删除相关行后,一切都很好。
然后,我尝试使用W3C RDF验证程序和RDF上的耶拿使用错误行,但是我得到的只是关于未定义语言的警告(错误行绝对没有)。
您能否建议一种在RDF文件中查找错误的方法(如果可能的话,请使用Java)?
编辑:有问题的行是:
<gn:alternateName xml:lang="got">𐌰𐍆𐌲𐌰𐌽𐌹𐍃𐍄𐌰𐌽</gn:alternateName>
最佳答案
您可以使用Sesame的Rio parser进行验证。 this blogpost中提供了有关一般如何与Rio一起使用的说明。具体来说,对于验证而言,诀窍是创建并附加一个ParseErrorListener,以便从解析器接收详细的警告和错误。
但是,由于您提到遇到的问题是在SAX / XML级别上,因此您也可以仅使用通用XML验证器来查看问题所在。最可能的原因(但是如果没有更多细节很难说明)是您的某处存在编码错误的字符。
关于rdf - RDF读取/解析错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8120638/