java - 使用正则表达式在 Java 中获取 HTML 行的一部分时遇到问题

标签 java html regex

我试图使用正则表达式获取 HTML 行中的一行的一部分,但无法让它工作。

这是 html(必要)部分:

(five random numbers)/ ">(the word I want to extract, between 2 and 45 characters)<

所以我使用这个正则表达式:

"[0-9]{5}\\/\\\"\\s\\>(\\.{1,45})\\<"

我无法让它工作......

当我在 Matcher< 的 .find() 之后尝试通过 group() 获取单词时,我总是收到“未找到匹配项”的消息。希望我说得足够清楚!

最佳答案

这应该做:

"[0-9]{5}/\"\\s>(.{1,45})<"

也许更好

"\\d{5}/\"\\s*>([^<]{1,45})<"

这也将允许捕获换行符,并防止以稍后的第二秒结束 < .

关于java - 使用正则表达式在 Java 中获取 HTML 行的一部分时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16268801/

相关文章:

java - 如何使用公历比较没有时间戳的日期?

java - 在 Java 中将 char 表示为一个字节

java - 使用单键改造发送多个图像

Python索引一个正则表达式匹配的列表

java - 在服务器上创建图表并从客户端访问它是糟糕的设计吗?

javascript - 如何去除页面上的滚动条

html - 链接不起作用(仅限初学者 html css)

javascript - 如何将选项卡 Pane 设置为动态或手动激活

regex - Mod 重写正则表达式 : How to allow only one period between other characters?

子目录中的 PHP 脚本在调用时自动请求根目录中的相同脚本