pandas - 替换列名称中的部分字符串

我在更改列名称时遇到问题。有一个部分我必须删除。表格如下所示

Column.name_1  Column.name_2  Column.*.name_3  Column_name_4  Column_*_name_5

我写了一行代码，将点和线改为下划线:

df_check.columns = df_check.columns.str.replace('.*.', '_')

但我明白了

Column_name_1  Column_name_2  Column___name_3  Column_name_4  Column___name_5

我需要以下只有一个 uderscore 的结果。

Column_name_1  Column_name_2  Column_name_3  Column_name_4  Column_name_5

你能帮我解决这个问题吗？问候

最佳答案

您可以使用:

df_check.columns = df_check.columns.str.replace(r'[.*_]+', '_', regex=True)

输出名称:

['Column_name_1', 'Column_name_2', 'Column_name_3', 'Column_name_4', 'Column_name_5']

关于pandas - 替换列名称中的部分字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/74741272/

相关文章：

Python pandas CustomBusinessDay