python - 如何删除pandas中多个括号之间的单词?

标签 python regex pandas

我想删除 pandas 数据框中的括号及其之间的单词。到目前为止,我已经搜索并发现这非常有帮助 -

df['Column'].str.replace(r"\(.*\)","")

但这会转换以下字符串-

柠檬(20% ...)、橙子(...)和苹果(...)完成。

(...包含其他字母)

柠檬完成。

但是,我希望输出是-

柠檬、橙子和苹果完成。

最佳答案

用途:

df['Column'].str.replace(r"\((.*?)\)","")

输出

Lemon , orange  and apple  done.

说明

  1. \( 与字符 ( 字面匹配(区分大小写)
  2. .*?匹配任何字符(行终止符除外)
  3. \) 与字符 ) 字面匹配(区分大小写)

P.S - 我发现 Regex101成为一个很好的正则表达式在线测试工具(我与它们没有任何关系)。

编辑

添加 + 可能适用于嵌套情况(未彻底测试) -

\(+(.*?)\)+

仅供引用 - 同意 @Ulrich 关于提出新问题的观点:-)

关于python - 如何删除pandas中多个括号之间的单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53138751/

相关文章:

python - 如何将 .swf 文件嵌入到我的 Google App Engine 应用程序中?

python - 是否可以在多个 GAE 应用程序之间共享数据存储

python - 如何在 Python 数据框中查找不共享公共(public)日期(或索引)的行

regex - Perl:如何在 linux 中获取模式之间的线条

PHP 正则表达式不工作 - 在本地服务器上返回 NULL,但在其他服务器上工作正常

python - 使用正则表达式从网页中提取表格

c - 标准C库的正则表达式匹配函数

python - 如何通过比较 pandas 中的两个数据帧来分割输入

python - Pandas/SQLITE 数据框图

pandas - 带有 Pandas 数据框的 loc 函数警告