NoSQL 数据库在数据挖掘方面比 OLAP 数据库更有用,或者它在哪些方面没那么有用?
从大量数据中快速检索数据同时拥有无模式数据库是否有优势?
最佳答案
关于高级查询功能
而且NoSQL 数据库通常在这里毫无用处。
它们专为极其原始的查询而设计,例如键值存储。
但是你不能用它做太多分析。
适合数据挖掘的数据库需要允许:
- 使用特定领域的相似函数查找相似记录(k 个最近邻居)
- 最近邻自连接、半径自连接
- 成对比较
- 优化数学方程和快速向量数学,最好使用 GPU 卸载
事实上,人们在挖掘数据库时所做的是 ETL:
- 通过
SELECT
提取他们需要的内容 - 将其转换为所需的方案
- 将其从数据库加载到数据挖掘应用程序中
即数据库执行 ETL,但数据挖掘发生在外部。
关于data-mining - NoSQL 作为数据挖掘解决方案?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35146523/