elasticsearch - Elastic Search - 它是适合分析团队的数据库吗?

标签 elasticsearch analytics business-intelligence dbt

我是一个分析团队的成员,该团队最近将其数据仓库迁移到了 Elastic Search 中。 DW 通过 Dremio 访问。

但是,我正在重新考虑 Elastic Search 是否适合执行大量日常分析的分析团队的数据库。我更希望我们将 DW 保存在 BigQuery/Snowflake/Redshift 之一中,并使用“dbt”工具转换数据并将其写回数据库。

从 Elastic Search 读取数据后,我找不到类似“dbt”的工具来执行快速数据转换,而且 Dremio 还不够成熟。我想征求您对 Elastic Search 的看法,以及它是否是适合日常分析的数据库。

感谢您的回复。

编辑: 我在一家在线零售商工作。我们的数据在任何意义上都不是“大数据”。每天大约有几千个订单。我们的大部分工作是回应来自各个团队/部门的询问。其中一些问题超出了简单的查询范围。我们必须构建定制的数据集市,其中涉及多个步骤。因此,我们需要一种工具,使我们能够快速转换数据并将结果集放入数据库。一个这样的工具是“dbt”,但它不支持 Elastic Search。所以问题是是否有适合这项工作的工具,或者 Elastic Search 不适合我们的用例。

最佳答案

考虑到

Our data is not "big data" in any sense.

很可能 ElasticSearch 不是合适的选择。使用 ES 的唯一原因是大量类似搜索的查询对文本类型字段进行“包含”过滤,并且仅当数据集太大而无法通过 SQL 兼容的数据库快速处理这些查询时。

看起来 PostgreSQL 可以胜任这项工作。如果您正在寻找用于快速 OLAP 查询(聚合)的列式数据库,您可以查看开源 ClickHouse。

最后,Dremio 并不是唯一可以与 ElasticSearch(或 PostgreSQL、ClickHouse 等)配合使用的 BI 工具。一些 BI 工具允许您对维度/度量使用“无痛”脚本,并且您可以直接在 ES 查询中计算很多东西。

关于elasticsearch - Elastic Search - 它是适合分析团队的数据库吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61753739/

相关文章:

elasticsearch - Elasticsearch + kibana 6.2与Elasticsearch + kibana 7.9

javascript - 刚刚在 wordpress 上安装了 Google Analytics,但未跟踪访问者

android - 如何统计 Google Play 商店 App 在给定时间段内的自动续订次数?

ios - 将 Power Bi 嵌入到 iOS 应用程序中

time - 如何将一周放入日历时间层次结构中?

css - OBIEE 12.2.1.2 - 仪表板自定义 - 部分属性 - 格式部分

elasticsearch - elasticsearch查询问题,范围查询格式错误,预期为END_OBJECT,但找到FIELD_NAME

c# - 如何将一个not_analyzed字段添加到Elasticsearch中

elasticsearch - Elasticsearch ,delete_by_query 需要很长时间才能完成并导致 http 请求超时

hadoop - 如何解析多个pdf转换成hadoop(例子)