database - 统计检测数据异常的最佳方法

标签 database statistics data-warehouse

我们的 webapp 收集了大量关于用户操作、网络业务、数据库负载等的数据

所有数据都存储在仓库中,我们对这些数据有很多有趣的看法。

如果发生奇怪的事情,它可能会出现在数据中的某个地方。

但是,要手动检测是否有异常情况发生,必须不断查看这些数据,寻找异常情况。

我的问题:检测动态数据变化的最佳方法是什么,这些变化可以被视为“异常”。

贝叶斯过滤器(我在阅读垃圾邮件检测时看到过这些)是可行的方法吗?

任何指针都会很棒!

编辑: 为了澄清数据,例如显示数据库负载的每日曲线。 这条曲线通常看起来与昨天的曲线相似 随着时间的推移,这条曲线可能会慢慢改变。

如果曲线每天都在某些范围内发生变化,则可能会发出警告,那就太好了。

R

最佳答案

看看Control Charts ,它们提供了一种直观地跟踪数据变化并指定数据何时“失控”或“异常”的方法。它们大量用于制造以确保质量控制。

关于database - 统计检测数据异常的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1306785/

相关文章:

database - Neo4j 图形数据库与属性的关系

mysql - 具有两个外键的表的 sql 到同一个表导致笛卡尔积

用于自动回归 (AR)、ARIMA、时间序列分析的 Java API

statistics - 如果两个分类器用于不一致的数据,如何以适当的方式合并它们

database - 事实表和维度表的区别?

php - 如何根据第三列中的值并按第四列分组来获得两列的总和?

ruby-on-rails - 数据库/模型夹具和原始状态

c# - WPF DataGrid 中基于基础数据集(及其类型)的动态 DataGrid 列

database - 如何从现有数据库实际构建数据仓库?

database - 如何在物理/逻辑上分离集成层和数据仓库,是否有必要?