hadoop - Hive 截断列数据

标签 hadoop hive hiveql

我在 hive 中有一张 table 。结构如下:

vid varchar(2)
vname varchar(10)

如果我在配置单元中加载以下数据,
123,xyz
111,anc
21,pqr

只有一条记录应插入配置单元,但所有 3 条记录都应插入,并将 vid 值从 123 截断为 12 并将 111 截断为 11。

任何人都可以为此提供任何解决方案吗?

最佳答案

Hive 不会过滤可以插入的数据,它只会截断超过列中定义长度的数据。对 Hive 行为存在误解。如果您想限制要插入的字段,您需要使用 length() 过滤行。和最大预期字段大小。

关于hadoop - Hive 截断列数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46563567/

相关文章:

sql - 比较 HIVE 中的两个表的相等性

python - "Failed to locate the winutils binary"但我的 pyspark 仍然有效

hadoop - 如果我只想将 HCatalog 与 Pig 和 MR 一起使用,是否需要安装 Hive?

hadoop - Hive索引重建与PostgreSQL相比太慢

mysql - 需要使用 Hive HQL 忽略列表列中的最后两个值

hadoop - 在Hive中使用 “Collect_List()”函数时出错

R+Hadoop : How to read CSV file from HDFS and execute mapreduce?

linux - 直接将文件从本地机器复制到远程HDFS集群

hadoop - 如何使用Sqoop以Parquet-Avro文件格式保存数据?

hadoop - 插入 Hive 分桶表时出现负数组大小异常