java - 使用 VTD-XML 的带有 & 符号的 XML 文件的 ParserException

标签 java xml parsing vtd-xml kanji

我正在尝试使用 VTD-XML 解析 JMDict 项目中的 JMDict_e.xml 文件。但是,我遇到了解析错误。

出现的唯一错误消息是:

ParserException: com.ximpleware.EntityException: Errors in Entity: Illegal entity char

XML 的简短摘录如下所示:

<entry>
    <ent_seq>1279770</ent_seq>
    <k_ele>
        <keb>構成要素</keb>
    </k_ele>
    <r_ele>
        <reb>こうせいようそ</reb>
    </r_ele>
    <sense>
        <pos>&n;</pos>
        <pos>&adj-no;</pos>
        <field>&comp;</field>
        <gloss>components</gloss>
        <gloss>elements</gloss>
        <gloss>parts</gloss>
    </sense>
</entry>

我相信在 pos 字段中,非法字符很可能是&符号。有没有办法让 vtd-xml 不将这些 & 符号视为特殊字符?或者有不同的方法来解决这个问题吗?

最佳答案

VTD-XML 只识别那些内置的字符实体。在我看来,大多数实体都是无效的。在将其提供给解析器之前,您可能需要解决这些问题。

关于java - 使用 VTD-XML 的带有 & 符号的 XML 文件的 ParserException,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44814801/

相关文章:

java - 如何为巴士预订应用程序添加过滤

java - 检查字符串是否以 _ 或数字 (0-9) 开头

json - 我想使用python3将 "command>systeminfo"的输出解析为json

sql-server - 从 T-SQL 构建 AST

java - 可以将异常存储在变量中以便稍后抛出吗?

android - GridView 中网格的填充

java - 如何在文本框下方显示三个标签和微调器?

xml - 在根节点中声明命名空间时,xslt 脚本不起作用

java - 解析日期时获取奇怪的数据

java - 来自 jsp :include being ignored? 的 response.sendRedirect()