Python pandas 替换列中的值

当我查看数据框中的列中的值时，我可以看到由于用户数据输入错误，相同的类别输入不正确。

对于我的数据框，我使用以下代码:

df['column_name'].value_counts()

输出:

 Targeted    523534
 targeted    1
 story       25425
 story       2
 multiple    2524543

对于故事，我想有一个空格？

我正在尝试将 Targeted 替换为 Targeted。

df['column_name'].replace("targeted","Targeted")

但是什么也没有发生，我仍然得到相同的值计数。

最佳答案

是的，似乎有开头和结尾的空白。

df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted")

df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted")

另一种可能的解决方案是将所有字符转换为小写:

df['column_name'] = df['column_name'].str.strip().str.lower()

关于Python pandas 替换列中的值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42121598/

相关文章：

python - 在 Python Pandas 中格式化字符串数字