data-mining - NoSQL 作为数据挖掘解决方案?

标签 data-mining olap data-analysis star-schema nosql

NoSQL 数据库在数据挖掘方面比 OLAP 数据库更有用,或者它在哪些方面没那么有用?

从大量数据中快速检索数据同时拥有无模式数据库是否有优势?

最佳答案

关于高级查询功能

而且NoSQL 数据库通常在这里毫无用处

它们专为极其原始的查询而设计,例如键值存储。

但是你不能用它做太多分析。

适合数据挖掘的数据库需要允许:

  • 使用特定领域的相似函数查找相似记录(k 个最近邻居)
  • 最近邻自连接、半径自连接
  • 成对比较
  • 优化数学方程和快速向量数学,最好使用 GPU 卸载

事实上,人们在挖掘数据库时所做的是 ETL:

  • 通过SELECT提取他们需要的内容
  • 将其转换为所需的方案
  • 将其从数据库加载到数据挖掘应用程序中

即数据库执行 ETL,但数据挖掘发生在外部。

关于data-mining - NoSQL 作为数据挖掘解决方案?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35146523/

相关文章:

python - 如何从 Pandas 中的 DatetimeIndex 获取滚动窗口内的持续时间

algorithm - 数据挖掘和基于文本的分析的模式识别

database - 什么是 OLTP 和 OLAP。它们之间有什么区别?

r - 根据 r 中另一个数据框中的列填充数据框中的列

java - 原始实时数据包中的 NSL KDD 功能?

machine-learning - K均值算法

sql-server - Microsoft SQL Server Analysis Services OLAP 多维数据集

python - 从 python 连接到 Azure 分析服务

r - 机器学习项目: split training/test sets before or after exploratory data analysis?

python - 通过实例理解 LocalOutlinerFactor 算法