java - 从 HTML 替换不起作用

标签 java html jsoup

我正在尝试删除 html 元素文本的额外空间,但它不起作用。 原来的html元素是:

<td class="thinborder" >&nbsp;text</td>

如果我使用 Jsoup 的 element.text() 访问这个,它会返回:

" text"

以下是我使用过的方法,但都不起作用:

String fixed = element.text().replace(" ", "");
String fixed = element.text().replace("nbsp;", "");
String fixed = element.text().replaceFirst(" ", "");

编辑: *修剪也不起作用

最佳答案

trim()字符串

String fixed = element.text().trim();

Returns a copy of the string, with leading and trailing whitespace omitted.

还可以尝试正则表达式

String result =  element.text().replaceAll("\\s+","");

如果您仍然无法让它工作,请尝试替换 unicode 空间

String result =  element.text().replace("\u00A0","");

关于java - 从 HTML 替换不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20862067/

相关文章:

java - 现代的 javadeps 等价物?

jQuery - 当屏幕小于1350px时按类删除div

html - "container"div 内的 <nav> 和 <section> 元素 --- 容器消失,除非指定了以像素为单位的特定高度

jQuery 获取字符在 Div 中的位置?

java - Android Jsoup HTML解析

java - 使用 JSoup 获取所有文本链接

java - Jenkins Sonar 检查失败 : Caused by: java. lang.ClassNotFoundException : org. sonar.api.checks.NoSonarFilter

java - 比较 Java 中的 2 个 HashMap

java - 用小数点逗号舍入 "string number"

java - 使用java解析xml并保留html标签