我有正则表达式,应该删除评论(是的,这很糟糕,但对我来说它有效)
String regex = (^\/\/.*)|(\s+\/\/.*)|((\/\*)(.|\n)+?(\*\/));
此代码应删除所有注释
Pattern.compile(regex).matcher(some text).replaceAll(" ");
但是我怎样才能删除除正则表达式之外的所有内容?
例如: 如果我有这样的字符串:
/*评论很酷*/
公共(public)静态无效foo(){}
我的正则表达式匹配注释,但我需要删除不匹配的内容,所以它看起来像:
/*Comments it's cool*/
最佳答案
基本上,您可以只匹配正则表达式匹配的内容,然后连接匹配的文本。这要容易得多。
对于删除除原始模式匹配之外的所有内容的正则表达式,您可以考虑使用捕获可选组捕获整个模式,并使用 .
来匹配其后面的任何字符。
假设您的模式是 abc
。它匹配abc
。但现在,您需要匹配相反的内容,即您的正则表达式不匹配的所有内容。使用
(?s)(abc)?.
并替换为$1
。请参阅regex demo 。
对于换行符可能需要进行一些调整。如果您不想删除换行符,请不要使用 DOTALL 修饰符。如果要使用它,请将原始模式中的 .
替换为 [^\n\r]
。请记住,您将能够使用某些 (\r?\n|\r){2,}
模式缩小空行(以及 $1
反向引用)。
所以,你的正则表达式是
String regex = "^\\s*//.*|/\*[^*]*\*+(?:[^/*][^*]*\*+)*/";
其中 /\*[^*]*\*+(?:[^/*][^*]*\*+)*/
匹配多行注释,^\\s*//.*
匹配单行注释。
要使其删除除匹配内容之外的所有内容,请使用
String regex = "(?sm)(^\\s*//[^\r\n]*|/\\*[^*]*\\*+(?:[^/*][^*]*\\*+)*/)?.";
并替换为$1
反向引用。请参阅regex demo (基于 ClasG demo )。请注意,我还为 ^
添加了 (?m)
MULTILINE 修饰符,以便在行的开头进行匹配。
关于java - 删除除与正则表达式 java 匹配的内容之外的所有文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37945614/