我试图使用正则表达式获取 HTML 行中的一行的一部分,但无法让它工作。
这是 html(必要)部分:
(five random numbers)/ ">(the word I want to extract, between 2 and 45 characters)<
所以我使用这个正则表达式:
"[0-9]{5}\\/\\\"\\s\\>(\\.{1,45})\\<"
我无法让它工作......
当我在 Matcher< 的
。希望我说得足够清楚!.find()
之后尝试通过 group()
获取单词时,我总是收到“未找到匹配项”的消息
最佳答案
这应该做:
"[0-9]{5}/\"\\s>(.{1,45})<"
也许更好
"\\d{5}/\"\\s*>([^<]{1,45})<"
这也将允许捕获换行符,并防止以稍后的第二秒结束 <
.
关于java - 使用正则表达式在 Java 中获取 HTML 行的一部分时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16268801/