amazon-athena - 哈希数组列 AWS Athena

标签 amazon-athena

我正在处理没有任何主键的数据。我正在尝试对唯一列进行哈希处理以创建代理键,但是由于数据包含数组,我遇到了问题。所以我确实想将数据保留在数组中,因为如果我将其更改为文本 block ,我就会失去嵌套。最终,我需要将行移动到列中,为了做到这一点,我需要唯一的键来连接回。

我已经尝试过

SELECT md5(to_utf8(array_column)) from my_table;

我还尝试将列转换为 varchar:

SELECT CAST(array_column as VARCHAR) from my_table

我不断收到提示该类型的结果: 意外参数(array(row(**剩余数据定义))

最佳答案

您可以使用uuid函数创建唯一标识符。例如:

select uuid(), ... from mytable

关于amazon-athena - 哈希数组列 AWS Athena,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68116626/

相关文章:

amazon-web-services - AWS Athena 删除表 + S3 位置

amazon-web-services - 读取 csv 文件,其中值包含 AWS athena 中的逗号

amazon-web-services - (AWS) 雅典娜 : Query Results seem too short

sql - 如何在aws athena中追加两个具有不同列的表

python - 如何在一台计算机上使用 Python 组合小型 Parquet 文件?

amazon-web-services - 由于破折号字符无法查询 Athena 表

sql - 如何在 AWS redshift 和 AWS athena 中以一致的方式将 YYYYMMDD 格式的字符串转换为日期,而无需进行字符串操作

sql - 新时间戳上的分区日期以获取上一个时间戳

amazon-web-services - 如何在 AWS Athena 中创建范围分区?

aws-lambda - 如何在 Lambda 中从 CloudFormation 访问 Athena QueryString?