java - hive 中的python udf

标签 java python sql hadoop hive

我想在python中编写配置单元udf来解析名称列(使用https://pypi.python.org/pypi/nameparser),并将解析后的值放在表的不同列中(标题,第一,中间,最后,后缀,昵称)。

我是python的新手,我这样写了python代码

#!/usr/bin/python
import sys
from nameparser import HumanName
name = HumanName(name)
return name.title

而在 hive 中我就是这样
add file title.py;
SELECT TRANSFORM (name) using 'title.py' AS (title STRING) from emp2;

但正在获取org.apache.hadoop.hive.ql.metadata.HiveException。

最佳答案

在select语句using子句中,您需要指定' python title.py'而不是title.py。

add file title.py;
SELECT TRANSFORM (name) using 'python title.py' AS (title STRING) from emp2;

关于java - hive 中的python udf,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26979369/

相关文章:

python - 这种数组是什么意思/做什么?

python - 云形成 : Pass List to Lambda Function

mysql - 删除 MySQL 中除重复行之外的所有重复行?

python - Django 中的 Bootstrap3 选项卡

sql - 复制同一表中的一行而无需键入 50 多个列名(同时更改 2 列)

mysql - 我可以在 SELECT 查询中重复使用计算字段吗?

java - 如何在服务器端存储邮件密码?

java - 使用java创建xml

Java try..catch 和finally

java - Android 图形的限制