python - 标准化 Python Pandas 数据框中的某些列？

标签 python pandas sklearn-pandas standardized

下面的 Python 代码只返回一个数组，但我希望缩放后的数据替换原始数据。

from sklearn.preprocessing import StandardScaler
df = StandardScaler().fit_transform(df[['cost', 'sales']])
df

输出

array([[ 1.99987622, -0.55900276],
       [-0.49786658, -0.45658181],
       [-0.5146864 , -0.505097  ],
       [-0.48104676, -0.47814412],
       [-0.50627649,  1.9988257 ]])

原始数据

id  cost    sales   item
1   300       50    pen
2   3         88    bottle
3   1         70    drink
4   5         80    cup
5   2        999    ink

最佳答案

简单地分配回来

df[['cost', 'sales']] = StandardScaler().fit_transform(df[['cost', 'sales']])
df
Out[45]: 
   id      cost     sales    item
0   1  1.999876 -0.559003     pen
1   2 -0.497867 -0.456582  bottle
2   3 -0.514686 -0.505097   drink
3   4 -0.481047 -0.478144     cup
4   5 -0.506276  1.998826     ink

关于python - 标准化 Python Pandas 数据框中的某些列？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49641707/

上一篇：python - 返回 pandas 列中存在的多个单词的计数

下一篇：python - sklearn 已安装，但 'sklearn' 不是我的 "sklearn.py"文件中的包

相关文章：

python - Twisted 中的非阻塞服务器

python - Pandas 数据框中以相同字符串开头的列的总和值

python - 如何混合pandas和beautifulsoup从xml文件目录中提取一些元素标签？

python - 如何将 Python 映射函数与 sklearn preprocessing.scale 结合使用？

python - Pandas - 如果观察到另一列(B 列)中的条件，则使用另一列(A 列)的值创建一列(C 列)

python - 管道中的 Sklearn_pandas 返回 TypeError : 'builtin_function_or_method' object is not iterable

python - 如何获取flask中html标签内变量的值？

python - 循环遍历文本文件，readline() 构造在大文件上失败

python - 如何在 Django 错误电子邮件中包含服务器主机名？

python - 将整数存储为整数而不是 float