python - 规范化数据框的列

标签 python pandas dataframe normalize

我在 pandas 中有一个数据框,其中每一列都有不同的值范围。例如:

df:

A     B   C
1000  10  0.5
765   5   0.35
800   7   0.09

知道如何规范这个数据框的列,其中每个值都在 0 和 1 之间?

我想要的输出是:

A     B    C
1     1    1
0.765 0.5  0.7
0.8   0.7  0.18(which is 0.09/0.5)

最佳答案

使用 Pandas 的一种简单方法:(这里我想使用均值归一化)

normalized_df=(df-df.mean())/df.std()

使用最小-最大标准化:

normalized_df=(df-df.min())/(df.max()-df.min())

编辑:为了解决一些问题,需要说 Pandas 在上面的代码中自动应用了 colomn-wise 函数。

关于python - 规范化数据框的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26414913/

相关文章:

python - 在 AppEngine 上支持多登录的最佳方式

python - 重复索引 : np. add.at/sparse.csr_matrix 的最快添加?

python - 如何将 CSV 文件转换为 python 字典

python - 将 pandas DataFrame 列中括号之间的文本复制到另一列

python - 在不使用索引的情况下替换 pandas DataFrame 中选定单元格的值

python - 带 f 字符串和 pandas 数据框的 For 循环

Python numpy recarray : Can one obtain a view into different fields using pointer arithmetic?

python - 如何避免在 python 中创建对象?

python - 如何证明(左) Pandas 数据框中的一列字符串?

python - 使用 pandas 将字符串列连接到新列时出现问题吗?