我正在创建一个 Web 服务,它接收字符串并将其转换为 XML。 XML 创建是通过 java dom4j 完成的。字符串的格式如下:
<form01><Textbox1 id="Textbox1" dataType="java.lang.String" perDataProId="">Site1</Textbox1><Textbox2 id="Textbox2" dataType="java.lang.String" perDataProId="">Site1</Textbox2></form01>
为了避免 XML 无效字符,我想我可以使用 StringReader 来读取字符串并删除 &,但我想知道如何删除 < 和 >?例如,如果输入字符串是
<form01><Textbox1 id="Textbox1" dataType="java.lang.String" perDataProId="">Site<1</Textbox1><Textbox2 id="Textbox2" dataType="java.lang.String" perDataProId="">Site1</Textbox2></form01>
如何删除“Site<1”中的“<”,同时保留其他类似的? 有什么建议吗?谢谢。
最佳答案
通常,XML API 在 XML DOM 中设置文本或稍后检索文本时会小心处理。
某些字符将被转换为 XML 实体:< > " ' &
.
还有some Characters not allowed在某些 XML 版本中,例如 \u0000
.
apache.commons.lang有一个StringEscapeUtils.escapeXML
如果您需要自己进行纯文本转换。
关于java - 从 XML 样式的字符串中删除无效字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56470487/