<分区>
目前我正致力于将 HTML 代码转换为 java 中的等效字符。 我需要将以下代码转换为字符。
è - è
® - ®
& - &
ñ - ñ
& - &
我尝试使用正则表达式模式
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
当我调试时,matcher.find()
给我 true
但控件会跳过我编写转换代码的循环。不知道那里发生了什么。
还有,有什么办法可以优化这个正则表达式吗?
感谢任何帮助。
异常
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)