hadoop - 如何在配置单元 udf 中使用 collect_set 的结果 - 评估方法？

Hive 查询 -

select ...MYUDF(collect_set(col1))..from tableN

这里的 col1 是字符串类型。我想对传递的 collect_set 数据执行某些逻辑。对于用户定义的函数，我正在扩展类 UDF 并使用评估方法。当数组从配置单元传递时，评估方法的签名 应该是什么。我想从 UDF 返回字符串数组。

public **<returnType>** evaluate(**<collect as what>**)
{
}

最佳答案

ArrayList<Text> ( import java.util.ArrayList )

关于hadoop - 如何在配置单元 udf 中使用 collect_set 的结果 - 评估方法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42834961/