我正在搜索用于解析 XML(复杂配置和数据文件)的 java 库,我用 google 搜索了一下,但除了 dom4j 之外找不到(似乎他们正在开发 V2)..我已经查看了 commons配置,但不喜欢它,其他 XML 上的 apache 项目似乎处于 hibernate 状态。我自己没有评估过 dom4j,只是想知道 - java 是否有其他(好的)开源 xml 解析库?您对 dom4j 的体验如何?
在@Voo的回答之后,让我问另一个问题 - 我应该使用java的内置类还是像dom4j这样的任何第三方库..有什么优点?
最佳答案
实际上,Java 支持 4 种开箱即用的解析 XML 的方法:
DOM 解析器/构建器:整个 XML 结构被加载到内存中,您可以使用众所周知的 DOM 方法来处理它。 DOM 还允许您使用 Xslt 转换写入文档。 示例:
public static void parse() throws ParserConfigurationException, IOException, SAXException {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setValidating(true);
factory.setIgnoringElementContentWhitespace(true);
DocumentBuilder builder = factory.newDocumentBuilder();
File file = new File("test.xml");
Document doc = builder.parse(file);
// Do something with the document here.
}
SAX Parser:仅读取XML文档。 Sax解析器遍历文档并调用用户的回调方法。有一些用于文档、元素等的开始/结束的方法。它们在 org.xml.sax.ContentHandler 中定义,并且有一个空的帮助器类 DefaultHandler。
public static void parse() throws ParserConfigurationException, SAXException {
SAXParserFactory factory = SAXParserFactory.newInstance();
factory.setValidating(true);
SAXParser saxParser = factory.newSAXParser();
File file = new File("test.xml");
saxParser.parse(file, new ElementHandler()); // specify handler
}
StAx 读取器/写入器:这适用于面向数据流的接口(interface)。当下一个元素准备好时,程序会像游标/迭代器一样请求下一个元素。您还可以用它创建文档。 阅读文档:
public static void parse() throws XMLStreamException, IOException {
try (FileInputStream fis = new FileInputStream("test.xml")) {
XMLInputFactory xmlInFact = XMLInputFactory.newInstance();
XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);
while(reader.hasNext()) {
reader.next(); // do something here
}
}
}
编写文档:
public static void parse() throws XMLStreamException, IOException {
try (FileOutputStream fos = new FileOutputStream("test.xml")){
XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();
XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);
writer.writeStartDocument();
writer.writeStartElement("test");
// write stuff
writer.writeEndElement();
}
}
JAXB:读取 XML 文档的最新实现:是 v2 中的 Java 6 的一部分。这允许我们从文档序列化 java 对象。您可以使用一个实现 javax.xml.bind.Unmarshaller 接口(interface)的类来阅读该文档(您可以从 JAXBContext.newInstance 获得一个类)。上下文必须使用所使用的类进行初始化,但您只需指定根类,而不必担心静态引用的类。 您使用注释来指定哪些类应该是元素(@XmlRootElement)以及哪些字段应该是元素(@XmlElement)或属性(@XmlAttribute,真是令人惊讶!)
public static void parse() throws JAXBException, IOException {
try (FileInputStream adrFile = new FileInputStream("test")) {
JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
Unmarshaller um = ctx.createUnmarshaller();
RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile);
}
}
编写文档:
public static void parse(RootElementClass out) throws IOException, JAXBException {
try (FileOutputStream adrFile = new FileOutputStream("test.xml")) {
JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
Marshaller ma = ctx.createMarshaller();
ma.marshal(out, adrFile);
}
}
无耻地从一些旧的讲座幻灯片中复制的示例;-)
编辑:关于“我应该使用哪个 API?”。好吧,这取决于 - 并非所有 API 都具有与您所看到的相同的功能,但如果您可以控制用于映射 XML 文档的类,JAXB 是我个人最喜欢的、非常优雅且简单的解决方案(尽管我还没有使用过它)非常大的文档,它可能会变得有点复杂)。 SAX 也很容易使用,如果您没有充分的理由使用它,请远离 DOM - 在我看来,这是旧的、笨重的 API。我认为没有任何现代第 3 方库具有 STL 所缺少的任何特别有用的功能,并且标准库具有经过非常良好的测试、记录和稳定的通常优点。
关于java - java中最好的XML解析库是哪个,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60393001/