java - 使用正则表达式在 Java 中获取 HTML 行的一部分时遇到问题

我试图使用正则表达式获取 HTML 行中的一行的一部分，但无法让它工作。

这是 html(必要)部分:

(five random numbers)/ ">(the word I want to extract, between 2 and 45 characters)<

所以我使用这个正则表达式:

"[0-9]{5}\\/\\\"\\s\\>(\\.{1,45})\\<"

我无法让它工作......

当我在 Matcher< 的 .find() 之后尝试通过 group() 获取单词时，我总是收到“未找到匹配项”的消息。希望我说得足够清楚!

最佳答案

这应该做:

"[0-9]{5}/\"\\s>(.{1,45})<"

也许更好

"\\d{5}/\"\\s*>([^<]{1,45})<"

这也将允许捕获换行符，并防止以稍后的第二秒结束 < .

关于java - 使用正则表达式在 Java 中获取 HTML 行的一部分时遇到问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16268801/

相关文章：

java - 如何使用公历比较没有时间戳的日期？