java - java中使用正则表达式匹配多行文本

标签 java regex pattern-matching

我的输入样本是:

<html xmlns:v="urn:schemas-microsoft-com:vml"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns:m="http://schemas.microsoft.com/office/2004/12/omml"
xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
<meta name=ProgId content=Word.Document>
<meta name=Generator content="Microsoft Word 15">
<meta name=Originator content="Microsoft Word 15">
<link rel=File-List href="detailedFoot_files/filelist.xml">

我想做的是选择整个 html 标签并将其替换为某些内容。所以我使用正则表达式

<html.*>

如果我以 Mather.DOTALL 方式使用此正则表达式,则整个文本输入将被替换。

我不知道该怎么做。任何形式的帮助将不胜感激。

最佳答案

这个正则表达式似乎捕获了您正在寻找的内容。

pattern = "\<html[^>]*>?(.*)"

<强> Sample Here

关于java - java中使用正则表达式匹配多行文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37770963/

相关文章:

javascript - 正则表达式 - 匹配包含 2 个或更多 2 个元音字母序列的单词

java - Java 中的正则表达式分组

haskell - 我什么时候应该使用 as-patterns 来识别常见的子表达式?

java - 使用 jpcap java 库时出错

java - LMAX干扰者: How to control the speed of producers?

Java 正则表达式匹配每 2 个字母之间带有可选多个注释的单词(如何反向引用正则表达式子表达式)

functional-programming - OCaml - 模式匹配与元组中的列表引用

java - 在不关闭浏览器的情况下关闭 Selenium,同时清理临时文件

java - Apache Camel 拦截,更新所有 RouteBuilder 的 Exchange 消息,然后继续

regex - 如何在每个单词的开头添加一个字符?