我正在自学 Pandas 和 Python,并试图弄清楚如何用字符串替换一列充满整数的列。假设我有一个充满年龄的数据集,我想将它们分组到新列中的类别。 年龄 < 30,替换为字符串“young” 年龄在30岁至50岁之间,替换为“中年” 年龄 > 50 ,替换为“年长”
最简单的方法是什么?
我研究了 .apply 和 .replace 对数据框的作用,但我很困惑。我应该学习什么是“lambda”吗?我应该定义一个函数然后使用 .apply 函数,还是有更简单的方法?非常感谢。
1 62
2 47
3 34
最佳答案
您可以创建一个函数来确定年龄:
def check(age):
if age > 50:
return 'Old'
elif 30 <= age <= 50:
return 'Middle'
else:
return 'Young'
然后使用apply()对所有数据进行编码。
res = df.apply(check)
结果:
0 62
1 47
2 34
0 Old
1 Middle
2 Middle
关于python - pandas 中的 .apply 与 .replace?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57565814/