java - 删除除与正则表达式 java 匹配的内容之外的所有文本

标签 java regex string

我有正则表达式,应该删除评论(是的,这很糟糕,但对我来说它有效)

String regex = (^\/\/.*)|(\s+\/\/.*)|((\/\*)(.|\n)+?(\*\/));

此代码应删除所有注释

Pattern.compile(regex).matcher(some text).replaceAll(" ");

但是我怎样才能删除除正则表达式之外的所有内容?

例如: 如果我有这样的字符串:

/*评论很酷*/ 公共(public)静态无效foo(){}

我的正则表达式匹配注释,但我需要删除不匹配的内容,所以它看起来像:

/*Comments it's cool*/

最佳答案

基本上,您可以只匹配正则表达式匹配的内容,然后连接匹配的文本。这要容易得多。

对于删除除原始模式匹配之外的所有内容的正则表达式,您可以考虑使用捕获可选组捕获整个模式,并使用 . 来匹配其后面的任何字符。

假设您的模式是 abc。它匹配abc。但现在,您需要匹配相反的内容,即您的正则表达式不匹配的所有内容。使用

(?s)(abc)?.

并替换为$1。请参阅regex demo

对于换行符可能需要进行一些调整。如果您不想删除换行符,请不要使用 DOTALL 修饰符。如果要使用它,请将原始模式中的 . 替换为 [^\n\r] 。请记住,您将能够使用某些 (\r?\n|\r){2,} 模式缩小空行(以及 $1 反向引用)。

所以,你的正则表达式是

String regex = "^\\s*//.*|/\*[^*]*\*+(?:[^/*][^*]*\*+)*/";

其中 /\*[^*]*\*+(?:[^/*][^*]*\*+)*/ 匹配多行注释,^\\s*//.* 匹配单行注释。

要使其删除除匹配内容之外的所有内容,请使用

String regex = "(?sm)(^\\s*//[^\r\n]*|/\\*[^*]*\\*+(?:[^/*][^*]*\\*+)*/)?.";

并替换为$1反向引用。请参阅regex demo (基于 ClasG demo )。请注意,我还为 ^ 添加了 (?m) MULTILINE 修饰符,以便在行的开头进行匹配。

关于java - 删除除与正则表达式 java 匹配的内容之外的所有文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37945614/

相关文章:

string - BSTR 和字符串

python - 在 Python 3.4.3 中将两个字符串列表组合在一起一次

Python Json解码数组到字符串

java - 使用 gson 将自定义数组列表保存到 Sharedpreferences

java - 如何追加/添加存储在数组列表中的文本

java - Retrofit 2 中同步请求和异步请求哪个更好

java - 像素帮助 - Java

java - 如何用Java匹配字符串中的阿拉伯Unicode字符?

python - 用于提取占位符匹配的正则表达式

regex - 如何在 AWK 的字段分隔符中使用抑扬符?