java - 哪个是java中用于XML解析的最佳库

标签 java xml parsing

我正在搜索用于解析 XML(复杂配置和数据文件)的 java 库,我用 Google 搜索了一下,但除了 dom4j 之外找不到其他东西(好像他们正在开发 V2).. 我看过 commons配置但不喜欢它,XML 上的其他 apache 项目似乎处于 hibernate 状态。我自己没有评估过 dom4j,只是想知道 - java 是否有其他(好的)开源 xml 解析库?以及您对 dom4j 的体验如何?

@Voo 的回答之后让我再问一个 - 我应该使用 java 的内置类还是任何第三方库,如 dom4j.. 有什么优势?

最佳答案

实际上 Java 支持 4 种开箱即用的 XML 解析方法:

DOM Parser/Builder:整个 XML 结构被加载到内存中,您可以使用众所周知的 DOM 方法来处理它。 DOM 还允许您使用 Xslt 转换写入文档。 示例:

public static void parse() throws ParserConfigurationException, IOException, SAXException {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    factory.setValidating(true);
    factory.setIgnoringElementContentWhitespace(true);
    DocumentBuilder builder = factory.newDocumentBuilder();
    File file = new File("test.xml");
    Document doc = builder.parse(file);
    // Do something with the document here.
}

SAX 解析器:仅用于读取 XML 文档。 Sax 解析器遍历文档并调用用户的回调方法。有用于开始/结束文档、元素等的方法。它们在 org.xml.sax.ContentHandler 中定义,并且有一个空的辅助类 DefaultHandler。

public static void parse() throws ParserConfigurationException, SAXException {
    SAXParserFactory factory = SAXParserFactory.newInstance();
    factory.setValidating(true);
    SAXParser saxParser = factory.newSAXParser();
    File file = new File("test.xml");
    saxParser.parse(file, new ElementHandler());    // specify handler
}

StAx 读取器/写入器:这适用于面向数据流的接口(interface)。程序在准备好时要求下一个元素,就像游标/迭代器一样。您还可以使用它创建文档。 阅读文档:

public static void parse() throws XMLStreamException, IOException {
    try (FileInputStream fis = new FileInputStream("test.xml")) {
        XMLInputFactory xmlInFact = XMLInputFactory.newInstance();
        XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);
        while(reader.hasNext()) {
            reader.next(); // do something here
        }
    }
}

写文档:

public static void parse() throws XMLStreamException, IOException {
    try (FileOutputStream fos = new FileOutputStream("test.xml")){
        XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();
        XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);
        writer.writeStartDocument();
        writer.writeStartElement("test");
        // write stuff
        writer.writeEndElement();
    }
}

JAXB:读取 XML 文档的最新实现:是 Java 6 v2 的一部分。这允许我们从文档中序列化 java 对象。您使用一个实现 javax.xml.bind.Unmarshaller 接口(interface)的类来阅读文档(您从 JAXBContext.newInstance 获得了一个用于此的类)。上下文必须使用使用的类进行初始化,但您只需要指定根类,而不必担心静态引用的类。 您使用注解来指定哪些类应该是元素(@XmlRootElement),哪些字段是元素(@XmlElement)或属性(@XmlAttribute,真是惊喜!)

public static void parse() throws JAXBException, IOException {
    try (FileInputStream adrFile = new FileInputStream("test")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Unmarshaller um = ctx.createUnmarshaller();
        RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile);
    }
}

写文档:

public static void parse(RootElementClass out) throws IOException, JAXBException {
    try (FileOutputStream adrFile = new FileOutputStream("test.xml")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Marshaller ma = ctx.createMarshaller();
        ma.marshal(out, adrFile);
    }
}

从一些旧的演讲幻灯片中无耻地复制示例;-)

编辑:关于“我应该使用哪个 API?”。好吧,这取决于 - 并非所有 API 都具有您所看到的相同功能,但如果您可以控制用于映射 XML 文档的类 JAXB 是我个人最喜欢的、非常优雅和简单的解决方案(尽管我没有使用它非常大的文档,它可能会变得有点复杂)。 SAX 也很容易使用,如果您没有充分的理由使用它,请远离 DOM——在我看来,这是旧的、笨重的 API。我认为没有任何现代 3rd 方库具有 STL 所缺少的任何特别有用的功能,而标准库通常具有经过良好测试、记录和稳定的优势。

关于java - 哪个是java中用于XML解析的最佳库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5059224/

相关文章:

java - 将字符串转换为二进制 [Java]

java - 将相同的 onClickListner 应用于自定义 ListView 中的所有项目时出错 [Android]

java - 如何使用 BeanUtils 自省(introspection)获取 Java 对象的所有属性列表?

java - 如何在 JAVA 泛型类型中定义使用 2 个泛型参数扩展 Map 对象?

xml - xpath通过属性获取节点值等于另一个节点的值

ios - iOS 中的单行 XML 解析器

java - 使用 Resources.getSystem() 从 .xml 获取 Android 中的字符串数组

php - 在 PHP 中解决一个数学问题/表达式,它是一个字符串

html - 如何从泰米尔语网站的不同网页中按顺序提取英文文本?

c# - 如何在 C# 中读取格式为 day.month.year 的日期?