python - 标准化 Python Pandas 数据框中的某些列?

标签 python pandas sklearn-pandas standardized

下面的 Python 代码只返回一个数组,但我希望缩放后的数据替换原始数据。

from sklearn.preprocessing import StandardScaler
df = StandardScaler().fit_transform(df[['cost', 'sales']])
df

输出

array([[ 1.99987622, -0.55900276],
       [-0.49786658, -0.45658181],
       [-0.5146864 , -0.505097  ],
       [-0.48104676, -0.47814412],
       [-0.50627649,  1.9988257 ]])

原始数据

id  cost    sales   item
1   300       50    pen
2   3         88    bottle
3   1         70    drink
4   5         80    cup
5   2        999    ink

最佳答案

简单地分配回来

df[['cost', 'sales']] = StandardScaler().fit_transform(df[['cost', 'sales']])
df
Out[45]: 
   id      cost     sales    item
0   1  1.999876 -0.559003     pen
1   2 -0.497867 -0.456582  bottle
2   3 -0.514686 -0.505097   drink
3   4 -0.481047 -0.478144     cup
4   5 -0.506276  1.998826     ink

关于python - 标准化 Python Pandas 数据框中的某些列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49641707/

相关文章:

python - Twisted 中的非阻塞服务器

python - Pandas 数据框中以相同字符串开头的列的总和值

python - 如何混合pandas和beautifulsoup从xml文件目录中提取一些元素标签?

python - 如何将 Python 映射函数与 sklearn preprocessing.scale 结合使用?

python - Pandas - 如果观察到另一列(B 列)中的条件,则使用另一列(A 列)的值创建一列(C 列)

python - 管道中的 Sklearn_pandas 返回 TypeError : 'builtin_function_or_method' object is not iterable

python - 如何获取flask中html标签内变量的值?

python - 循环遍历文本文件,readline() 构造在大文件上失败

python - 如何在 Django 错误电子邮件中包含服务器主机名?

python - 将整数存储为整数而不是 float