java - 在 Xerces 中从 DOM 获取 XML 实体替换文本

标签 java xml dom entities xerces

org.w3c.dom.Entity 的 Javadoc状态:

XML does not mandate that a non-validating XML processor read and process entity declarations made in the external subset or declared in parameter entities. This means that parsed entities declared in the external subset need not be expanded by some classes of applications, and that the replacement text of the entity may not be available. When the replacement text is available, the corresponding Entity node's child list represents the structure of that replacement value. Otherwise, the child list is empty.


无论如何,我已经针对已在内部子集(如图所示)和外部子集中声明的实体测试了以下方法(使用 Xerces),但是 foo.hasChildNodes() 在每种情况下都返回 false(并且 foo.getChildNodes() 返回 foo!):

// some trivial example XML
String xml = "<!DOCTYPE example [ <!ENTITY foo 'bar'> ]>\n<example/>";
InputStream is = new ByteArrayInputStream(xml.getBytes());

// parse
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
DocumentType docType = builder.parse(is).getDoctype();

// retrieve the entity - works fine
Entity foo = (Entity) docType.getEntities().getNamedItem("foo");

// now how to get the entity's replacement text?



从目前的答案来看,我的 Xerces 实现似乎有问题。我将尝试将所有 Xerces 库更新到最新版本,如果这解决了我的问题,我将关闭该问题。非常感谢。




我认为您可能误解了替换文本的工作原理。根据一些阅读 (,在我看来替换文本就像一个变量。因此,在上面的示例中,您永远不会引用 &foo; 实体。如果您运行下面的代码示例,您将看到 &foo; 被替换为字符串 bar:

// some trivial example XML
String xml = "<!DOCTYPE example [ <!ENTITY foo 'bar'> ]><example><foo>&foo;</foo></example>";
InputStream is = new ByteArrayInputStream(xml.getBytes());

// parse
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(is);
DocumentType docType = doc.getDoctype();

// retrieve the entity - works fine
Entity foo = (Entity) docType.getEntities().getNamedItem("foo");
for(int i = 0; i < foo.getChildNodes().getLength(); i++) {

您看到打印的是 [#text: bar],这是 XML 中的文本替换。

关于java - 在 Xerces 中从 DOM 获取 XML 实体替换文本,我们在Stack Overflow上找到一个类似的问题:


events - jQuery 更改事件未从键盘触发?

javascript - 如何更改 JS 中的字体大小以适合其容器?

java - Java JPA 一对多关系的问题

java - 使用JAVA和UNIX运行Pig命令

excel - VBA XML : Find root nodes for multiple namespaces

java - GWT 中的 XML 解析

java - 如何将 Chartboost 依赖项添加到我的 LibGDX 项目?

java - 无法在 java 中从 String 转换为 float

java - Android Java,为什么我的按钮使我的应用程序崩溃

javascript - 文档 = 'blue' ; = 18px';不适用于 Android WebKit