我们的 webapp 收集了大量关于用户操作、网络业务、数据库负载等的数据
所有数据都存储在仓库中,我们对这些数据有很多有趣的看法。
如果发生奇怪的事情,它可能会出现在数据中的某个地方。
但是,要手动检测是否有异常情况发生,必须不断查看这些数据,寻找异常情况。
我的问题:检测动态数据变化的最佳方法是什么,这些变化可以被视为“异常”。
贝叶斯过滤器(我在阅读垃圾邮件检测时看到过这些)是可行的方法吗?
任何指针都会很棒!
编辑: 为了澄清数据,例如显示数据库负载的每日曲线。 这条曲线通常看起来与昨天的曲线相似 随着时间的推移,这条曲线可能会慢慢改变。
如果曲线每天都在某些范围内发生变化,则可能会发出警告,那就太好了。
R
最佳答案
看看Control Charts ,它们提供了一种直观地跟踪数据变化并指定数据何时“失控”或“异常”的方法。它们大量用于制造以确保质量控制。
关于database - 统计检测数据异常的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1306785/