当我查看数据框中的列中的值时,我可以看到由于用户数据输入错误,相同的类别输入不正确。
对于我的数据框,我使用以下代码:
df['column_name'].value_counts()
输出:
Targeted 523534
targeted 1
story 25425
story 2
multiple 2524543
对于故事,我想有一个空格?
我正在尝试将 Targeted 替换为 Targeted。
df['column_name'].replace("targeted","Targeted")
但是什么也没有发生,我仍然得到相同的值计数。
最佳答案
是的,似乎有开头和结尾的空白。
需要str.strip
先然后Series.replace
或Series.str.replace
:
df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted")
df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted")
另一种可能的解决方案是将所有字符转换为小写:
df['column_name'] = df['column_name'].str.strip().str.lower()
关于Python pandas 替换列中的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42121598/