Python 3.5,来自 sklearn 的预处理
df = quandl.get('WIKI/GOOGL')
X = np.array(df)
X = preprocessing.scale(X)
最佳答案
preprocessing.scale() 算法将您的数据放在一个尺度上。这对于大量稀疏的数据集很有帮助。简而言之,您的数据分布广泛。例如 X 的值可能是这样的:
X = [1, 4, 400, 10000, 100000]
稀疏性的问题在于它非常有偏见或在统计术语中是偏斜的。因此,因此,缩放数据会将您的所有值都集中在一个尺度上,从而消除了稀疏性。关于了解它在数学细节上的工作原理,这遵循相同的规范化和标准化概念。您可以对这些进行研究,以详细了解其工作原理。但为了让生活更简单,sklearn 算法会为您做一切!
关于python - preprocessing.scale() 做什么?它是如何工作的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42325212/