我在更改列名称时遇到问题。有一个部分我必须删除。表格如下所示
Column.name_1 Column.name_2 Column.*.name_3 Column_name_4 Column_*_name_5
我写了一行代码,将点和线改为下划线:
df_check.columns = df_check.columns.str.replace('.*.', '_')
但我明白了
Column_name_1 Column_name_2 Column___name_3 Column_name_4 Column___name_5
我需要以下只有一个 uderscore 的结果。
Column_name_1 Column_name_2 Column_name_3 Column_name_4 Column_name_5
你能帮我解决这个问题吗? 问候
最佳答案
您可以使用:
df_check.columns = df_check.columns.str.replace(r'[.*_]+', '_', regex=True)
输出名称:
['Column_name_1', 'Column_name_2', 'Column_name_3', 'Column_name_4', 'Column_name_5']
关于pandas - 替换列名称中的部分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74741272/