我意识到之前有人问过类似的问题,解决方案是使用 StringEscapeUtils.unescape() .但是,根据方法描述:
Supports only the five basic XML entities (gt, lt, quot, amp, apos). Does not support DTDs or external entities.
我有一堆带有转义字符的 XML 文件,例如 ␣
和 &hyph;
。我怎样才能避免这些?它们在提供的 DTD 中定义。是否有类似 StringEscapeUtils 的方法,但有 DTD 支持?
最佳答案
嗯,已经很久了,但我认为 EntityResolver2
(Java SDK) 的实现处理外部定义的实体。这是 SAX2 规范的一部分。
关于java - 如何在 Java 中转义 XML 中的非标准字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6012746/