java - 从大型 XML 文件中删除不可打印和/或 unicode 字符

标签 java xml jaxb sax

我有一个接收包含 XML 数据的 File 对象的方法。文件可能超过 50 MB。有没有一种方便的方法可以从中删除控制字符和/或不可打印的字符。

对于较小的文件,我将文件内容读取为字符串并使用replaceAll("\p{Cntrl}", "")。

最佳答案

1).使用notepad++或ms word并使用查找/替换 2)使用bufferedStream编写java程序查找并替换stringtokens

关于java - 从大型 XML 文件中删除不可打印和/或 unicode 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12513061/

相关文章:

java - 存储 api key (客户端)的最可靠方法?

java - Espresso : What are the advantages/disadvantages of having multiple tests vs. 一个用户旅程?

Java 泛型困惑

java - xstream 未解析根元素

java - jaxb 和 serializable from marshalling server.xml for tomcat server

scala - 序列化问题 "scala.math.BigDecimal does not have a no-arg default constructor"

java - 如何修复 API 版本 23 的 androidx 中的 FloatingActionButton 膨胀错误?

java - 每次我单击“登录”按钮时,应用程序都会崩溃

java - JAXB:带注释的实例的编码列表

XML Schema 格式不正确,我的问题是什么?