stream - 流数据的标准化方法

标签 stream machine-learning data-mining normalization

我正在使用 Clustream 算法,并且我发现我需要标准化我的数据。我决定使用最小-最大算法来执行此操作,但我认为通过这种方式,随着最小值和最大值的值可能发生变化,新出现的数据对象的值将以不同的方式计算。你认为我说得对吗?如果是这样,我应该使用哪种算法?

最佳答案

您可以使用基于滑动窗口的局部标准化(例如仅使用最后 15 秒的数据),而不是根据整个数据计算全局最小值-最大值。这种方法在信号和图像处理计算局部均值滤波器时非常常见。

希望对你有帮助。

关于stream - 流数据的标准化方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31613885/

相关文章:

nlp - TF-IDF 和余弦相似度的替代方案(比较不同格式的文档)

node.js - 使用带有 http 请求的 HighlandJS 流

Java 8 从输入流读取到输出流,同时聚合项

data-structures - KD树的实现

machine-learning - 最佳强化学习器优化器

java - 如何在java中使用R模型来预测多个模型?

php - 使用 PHP 进行文本挖掘

html - ffmpeg 流桌面代替 -i/dev/video0

ios - 无法播放 SoundCloud 的某些轨道

python - 加载 xgboost 模型返回 NoneType