我有一个包含多行的文本文件。我将尝试设置一种模式,在文本的某些行中添加一个新的回车符。这条线是这样的:
lorem ipsum.
dolor sit amet, consectetur adipiscing elit [FIS] Donec feugiat
好吧,这个模式是一行后面跟着其他的,它有一些字符和一个 '[' 字符。如果“[”不存在,则模式失败并且未添加回车。
如何使用正则表达式来实现?
我也在使用 C# 作为编程语言和正则表达式引擎。
最佳答案
如果你想在 .然后你只需用它自己和一个换行符替换它。为确保它是最后一个字符,请使用前瞻检查它后跟空格,即 (?=\s)
因此,要替换为换行符(在大多数情况下推荐):
replace( input , '\.(?=\s)' , '\.\n' )
如果您必须使用回车(并且很少有地方需要它,即使在 Windows 上也是如此),您可以简单地添加一个:
replace( input , '\.(?=\s)' , '\.\r\n' )
如果你想确保一个 .后面总是跟两个换行符,如果已经需要,则不会导致额外的换行符,然后它会变得有点复杂,并且需要一个负面的前瞻,但看起来像这样:
replace( input , '\.(?!\S)(?:\r?\n){0,2}' , '\.\r\n\r\n' )
因为正则表达式引擎默认为贪心,{0,2}
将尝试匹配两次,然后一次,然后是零次 - 此时非空格的负先行确保它实际上是一个词的结尾。
(如果你可能有两个以上的换行符并且想减少到两个,你可以只使用 {0,}
代替,它有 *
作为快捷符号.)
可能值得指出的是,以上都不会占用任何空格/制表符 - 如果需要,可以将前瞻从 (?=\s)
更改为 \s+
,您可以用 \n
再次替换 \n[\t]+
以删除任何前导空格/制表符或类似内容,具体取决于什么你正在尝试做。
关于c# - 如何使用正则表达式在文本中添加回车符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1661946/