json - 使用 get_json_object 在 HIVE 中创建 View 后查询性能?

标签 json hadoop hive cloudera hortonworks-data-platform

Hive get_json_object 函数是否解析每个 JSON 对象以进行字段解析,即使我们在 JSON 数据之上创建 View 之后也是如此?

我们在使用 SERDE 读取 JSON 数据时遇到问题。出于这个原因,我们想使用这个 udf 并在数据之上创建 View 。

问题是担心将来使用此路径查询数据可能会很慢。

如果在 Hive 表之上创建 View 将在创建 View 时只解析一次数据,这将很有帮助。

Hive 是否支持这个?

Hive 专家对此有何想法?

最佳答案

我相信 Hive 确实支持观点。不过,如果您担心它的速度,您可以加载 impala。它使用与 hive 相同的元数据和表,但用户查询速度要快得多。

关于json - 使用 get_json_object 在 HIVE 中创建 View 后查询性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33286225/

相关文章:

java - MongoDB Java 驱动程序 Jackson Mapper MongoJack

performance - HBase 客户端写入性能差

java - reducer 可以将消息传递给Hadoop mapreduce中的驱动程序吗?

hadoop - 无法调试 HQL 脚本

hadoop - 如何在配置单元中获取所有可能的模式

json - 存储 json、jsonb、hstore、xml、enum、ipaddr 等失败,显示 "column "x“是 json 类型,但表达式是字符类型变化”

javascript - 在单个 Json 中连接元素

java - 客户端响应Application.Json

hadoop - Hive 使用收集聚合

xml - 如何附加 xml 数据并在配置单元中添加 xml 版本和编码