java - 将 Java w3c 文档转换为 XMLStreamReader

标签 java xml stax xmlstreamreader

我想在我们的代码库中重用一些现有代码,这些代码接受 XMLStreamReader 我的应用程序具有所需的数据作为 w3c 文档。

下面的例子是一个最小的测试用例:

public static void main(String[] args) throws Exception {
    DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = builderFactory.newDocumentBuilder();

    Document doc = builder.newDocument();

    Element rootElement = doc.createElement("Groups");
    doc.appendChild(rootElement);
    Element group = doc.createElement("Group");
    group.setTextContent("Wibble");
    rootElement.appendChild(group);

    DOMSource source = new DOMSource(doc);

    XMLStreamReader reader = XMLInputFactory.newInstance().createXMLStreamReader(source);

    reader.nextTag();
    System.out.println("NextTag:" + reader.getName());
}

预期的输出应该类似于:NextTag:Groups 但会抛出以下内容:

Exception in thread "main" javax.xml.stream.XMLStreamException: java.net.MalformedURLException
    at com.sun.xml.stream.XMLReaderImpl.setInputSource(XMLReaderImpl.java:196)
    at com.sun.xml.stream.XMLReaderImpl.<init>(XMLReaderImpl.java:179)
    at com.sun.xml.stream.ZephyrParserFactory.createXMLStreamReader(ZephyrParserFactory.java:139)
    at Main.main(Main.java:27)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at com.intellij.rt.execution.application.AppMain.main(AppMain.java:120)
Caused by: java.net.MalformedURLException
    at java.net.URL.<init>(URL.java:601)
    at java.net.URL.<init>(URL.java:464)
    at java.net.URL.<init>(URL.java:413)
    at com.sun.xml.stream.XMLEntityManager.startEntity(XMLEntityManager.java:762)
    at com.sun.xml.stream.XMLEntityManager.startDocumentEntity(XMLEntityManager.java:697)
    at com.sun.xml.stream.XMLDocumentScannerImpl.setInputSource(XMLDocumentScannerImpl.java:300)
    at com.sun.xml.stream.XMLReaderImpl.setInputSource(XMLReaderImpl.java:193)
    ... 8 

当前使用 Java 6 更新 22。

更多信息:ZephyrParserFactory#jaxpSourcetoXMLInputSource 的来源似乎表明 Source 对象是通过处理它的 SystemId 而不是 DOMSource 的实际内容来转换的。

更新:我上面的原始测试用例实际上是使用我的项目类路径运行的,该路径实际上包括 JAXB 2.2.1 库,该库又引入了 sjsxp 1.0.1。在干净的类路径上运行会产生:

Exception in thread "main" java.lang.UnsupportedOperationException: Cannot create XMLStreamReader or XMLEventReader from a javax.xml.transform.dom.DOMSource
    at com.sun.xml.internal.stream.XMLInputFactoryImpl.jaxpSourcetoXMLInputSource(XMLInputFactoryImpl.java:302)
    at com.sun.xml.internal.stream.XMLInputFactoryImpl.createXMLStreamReader(XMLInputFactoryImpl.java:145)

这符合@Gary Rowe 的回答。

最佳答案

这有点令人费解,但任何支持 XQJ API 的 XQuery 实现(例如 Saxon)都允许您提供 DOM 作为查询“.”的输入,并获得作为 XMLStreamReader 的结果。尽管涉及很多重量级机器,但它应该非常高效。

使用 Saxon,您还可以使用类似的东西来短路事物的 XQuery 端

Document doc; // the DOM document
XMLStreamReader reader = new PullToStax(PullProvider.makePullProvider(new DocumentWrapper(doc));

但我认为 XQJ 方法更简洁。

关于java - 将 Java w3c 文档转换为 XMLStreamReader,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7257508/

相关文章:

java - Spring Boot cron 表达式问题 - 禁用启动时运行

java - 我在哪里可以在 Ubuntu 机器上配置 Ant 1.8 的环境变量?

java - Java Synchronized(Object obj) 真正阻止了什么?

java - 在 java 中使用嵌套的 xml 开始标记 <?xml ...?> 解析 XML

Python XML-RPC <struct> 数据类型

java - 如何使用 Java 正确迭代 xml?

java - Tomcat v8+Servlet v3.1 在运行 servlet 时出现 404 错误

XML 模式限制。 "x.x"的模式,类似于表示版本号的属性值

java - 如何在 JAVA 中使用 STAX 解析器读取标签内的值

java - 如何使用 STAX 记住 XMLStreamReader 在 xml 中的位置