python-3.x - 空白字符串的正则表达式

我有一个字符串:

s=

"(2021-06-29T10:53:42.647Z) [Denis]: hi
(2021-06-29T10:54:53.693Z) [Nicholas]: TA FOR SHOWING
(2021-06-29T11:58:29.053Z) [Nicholas]: how are you bane 
(2021-06-29T11:58:29.053Z) [Nicholas]: 
(2021-06-29T11:58:29.053Z) [Nicholas]: #END_REMOTE#
(2021-06-30T08:07:42.029Z) [Denis]: VAL 01JUL2021
(2021-06-30T08:07:42.029Z) [Denis]: ##ENDED AT 08:07 GMT##"

我想从中提取文本。预期输出为:

comments=['hi','TA FOR SHOWING','how are you bane',' ','#END_REMOTE#','VAL 01JUL2021','##ENDED AT 08:07 GMT##']

我尝试过的是:

comments=re.findall(r']:\s+(.*?)\n',s)

正则表达式运行良好，但我无法将空白文本获取为 ''

最佳答案

您可以在捕获组中排除匹配 ] ，如果您还想匹配最后一行的值，则可以断言字符串 $ 的结尾code> 而不是将强制换行符与 \n

匹配

注意，\s 可以匹配换行符，否定字符类 [^]]* 也可以匹配换行符

]:\s+([^]]*)$

Regex demo | Python demo

import re

regex = r"]:\s+([^]]*)$"

s = ("(2021-06-29T10:53:42.647Z) [Denis]: hi\n"
    "(2021-06-29T10:54:53.693Z) [Nicholas]: TA FOR SHOWING\n"
    "(2021-06-29T11:58:29.053Z) [Nicholas]: how are you bane \n"
    "(2021-06-29T11:58:29.053Z) [Nicholas]: \n"
    "(2021-06-29T11:58:29.053Z) [Nicholas]: #END_REMOTE#\n"
    "(2021-06-30T08:07:42.029Z) [Denis]: VAL 01JUL2021\n"
    "(2021-06-30T08:07:42.029Z) [Denis]: ##ENDED AT 08:07 GMT##")

print(re.findall(regex, s, re.MULTILINE))

输出

['hi', 'TA FOR SHOWING', 'how are you bane ', '', '#END_REMOTE#', 'VAL 01JUL2021', '##ENDED AT 08:07 GMT##']

如果您不想越界:

]:[^\S\n]+([^]\n]*)$

Regex demo

关于python-3.x - 空白字符串的正则表达式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69897354/

上一篇：yugabytedb - 出现 fatal error : conversion between WIN1252 and UTF8 is not supported when connecting to YSQL from Windows

下一篇：assembly - 有什么方法可以缩短 AArch64 汇编中的机器代码 Hello World 吗？

c# - 忽略大小写比较两个字符串的最佳方法

python-3.x - 值错误: Unknown label type

python - helpers.scan() 不滚动 - ElasticSearch

regex - 在 Excel 中使用正则表达式，我可以在替换匹配的字符串之前对匹配的模式执行一些算术运算吗？

python - 用正则表达式检查大小写？

python - Str 包含 from 列表并按列表项区分

python-3.x - 使用python将任何音频文件转换为mp3

php - 无法找出这个正则表达式的解决方案

java - 这个方法会被调用吗？ (仍然需要一个可接受的答案......查看答案中的详细信息)