Java - 从字符串中提取html信息

标签 java html string tags extract

所有指南都告诉我如何从文本中删除 HTML 标签以提取它们之间的文本。我所追求的是提取 HTML 标记内的数据。

例如

如果我有一个字符串:

 "<FONT SIZE="5">Hello World</FONT>"

我想获取字体大小信息来更新其他变量。我该怎么办?

最佳答案

我用过jsoup为此目的多次。这是一个宽松的 HTML 解析器。尝试将其解析为“标准”XML 时要小心,因为 XML 解析本质上是严格的,如果页面不符合 XML 标记规范(很少有 HTML 页面会这样做),就会失败。

关于Java - 从字符串中提取html信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12634811/

相关文章:

java - 在不知道图像路径的情况下将图像添加到 JTooltip(由于图像是临时资源)

html - <tr> 不显示 cms 页面的边框

javascript - 是否有用于将字符串编码为 HTML 的内置 jQuery 函数?

c# - 我怎样才能保护字符串,例如C#

java - 级联求和运算

java - 修改Servlet参数

c# - 如何从 void 函数返回数据?

c - 指向字符串的指针 - C

java - 从下拉列表中随机选择?

html - @font-face 具有多个字体系列