java - 如何从 HTML 中提取字体标签?

标签 java android html

我正在尝试提取字体名称,例如:

String htmlContent = "<font face=\"impact\">Hdjdjdisid <font style=\"background-color:#ff0000\"> shejej</font></font>";

至:

impact

这是我在网上找到的,但它返回所有标签的内容,而我只想要face名称。

String pattern = "<FONT (.*?)>";

Pattern p = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(htmlContent);

if (m.find()) {
    // prints: <FONT FACE="Verdana" SIZE="12"> My Name is xyz </FONT></P>
    System.out.println(m.group());

    // prints: FACE="Verdana" SIZE="12"
    System.out.println(m.group(1));
}

如何只提取人脸姓名?

最佳答案

在这个简单的例子中,调整你的模式如下:

<font[^>]+face="([^"]+)"

转义以便与 java 一起使用:

String pattern = "<font[^>]+face=\"([^\"]+)\"";

但正如其他人指出的:不要使用正则表达式解析 html。

关于java - 如何从 HTML 中提取字体标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31425884/

相关文章:

javascript - jQuery Toggle 第二次无法正常工作

jQuery:html()函数获取表单中的旧数据

java - 试图将 setEditable 设置为 false 但出现错误

java - java中如何组合数组列表字符串?

android - 如何在 android studio 2.3.1 中创建 android 项目。没有为 android 项目提供选项?

Android:重叠两个 View (故意的!)

java - 使用 CQL 3.0 在集合上创建自定义索引

java - ReentrantReadWriteLock(java)-在读取锁内嵌套写入锁

android - 线圈不使用 Jetpack Compose 在模拟器中加载图像

Javascript 或 JQuery 写入表中指定列索引的所有行