python - 如何删除多层括号python中的文本

标签 python regex text

我有一个 python 字符串,我需要删除括号。标准的做法是使用text = re.sub(r'\([^)]*\)', '', text),所以括号内的内容会被去掉。

但是,我只是找到了一个看起来像 (Data with in (Boo) And good luck) 的字符串。使用我使用的正则表达式,它仍然会有 And good luck) 部分。我知道我可以扫描整个字符串并尝试保留 () 数量的计数器,当数字平衡时,索引 ( ) 并删除中间的内容,但是有更好/更干净的方法吗?它不需要是正则表达式,无论它能做什么都很好,谢谢。

有人询问了预期的结果,所以这就是我所期待的:

Hi this is a test ( a b ( c d) e) 句子

替换后我希望它是 Hi this is a test sentence,而不是 Hi this is a test e) sentence

最佳答案

使用 re 模块(替换最里面的括号,直到没有更多替换可做):

import re

s = r'Sainte Anne -(Data with in (Boo) And good luck) Charenton'

nb_rep = 1

while (nb_rep):
    (s, nb_rep) = re.subn(r'\([^()]*\)', '', s)

print(s)

随着regex module允许递归:

import regex

s = r'Sainte Anne -(Data with in (Boo) And good luck) Charenton'

print(regex.sub(r'\([^()]*+(?:(?R)[^()]*)*+\)', '', s))

其中 (?R) 指的是整个模式本身。

关于python - 如何删除多层括号python中的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39026120/

相关文章:

正则表达式匹配文件名中的字符串,同时排除另一个字符串

javascript - Handlebar Helper 将字符串中的 URL 替换为包含匹配 URL 的 HTML 字符串?

python - Python 类中的池

python - 无法在 Django 模型中将字符串转换为 float

regex - 如何判断正则表达式中的匹配项之间是否存在三个或更多字符?

c# - 如何使用 C# 从文本中提取人名和地名?

android - android中EditText的多行文本对齐

java - 我可以突出显示 JLabel 中的文本吗?

python - 使用 mock_open 修补函数哪里出错了?

python - Ruby 在 Python 中的 tap 习语