java - 大型 XML 的高效解析器

标签 java python xml parsing sax

我有非常大的 XML 文件要处理。我想将它们转换为具有颜色、边框、图像、表格和字体的可读 PDF。我的机器上没有很多资源,因此,我需要我的应用程序是非常优化的寻址内存和处理器。

我做了一个不起眼的研究来确定要使用的技术,但我无法决定哪种编程语言和 API 最适合我的要求。我认为 DOM 不是一个选项,因为它会消耗大量内存,但是,带有 SAX 解析器的 Java 会满足我的要求吗?

有些人还推荐使用 Python 进行 XML 解析。有那么好吗?

非常感谢您的建议。

最佳答案

SAX 是非常好的解析器,但它已经过时了。

最近 Oracle 推出了名为 Stax 的新解析器来有效解析 xml 文件

* http://docs.oracle.com/cd/E17802_01/webservices/webservices/docs/1.6/tutorial/doc/SJSXP2.html *

附加链接还将显示所有解析器的比较以及内存利用率及其功能。

谢谢, 帕万

关于java - 大型 XML 的高效解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17017966/

相关文章:

xml - 我的 XPATH 表达式无法正常工作

java - 正斜杠在 Path.resolve 中可以跨平台工作吗?

java - 找不到符号 findViewById

java - Android 2.3X 将应用程序杀死到后台

java - 小程序异常 : java. lang.ClassNotFoundException

python - 如何从列表 : python 中检索特定值

python - 如果我不尝试迭代,为什么我会得到 "type ' bool' is not iterable"?

python - model.predict 导致 oom 问题,但 model.fit 不会 :

c# - 在XPath中,无论有哪个文本子节点,如何通过文本选择节点?

javascript - 抓取javascript网站