hadoop - 如何仅使用Hive中的regexp_extract函数提取标点符号

标签 hadoop hive

我正在 hive 中学习regexp_extract函数,假设我有表'A'和列'word'为,
A word Hello! world, how are you?
我只想提取标点符号,以便输出,
! , ?
我如何尝试使用regexp_extract进行以下操作,但未获得所需的输出,
select regexp_extract(word,"[^A-Za-z0-9]*","1") from A;
请指导!

最佳答案

hive> with A as (select explode(array('word','Hello!','world,','how','are','you?')) as word)
    > select  regexp_extract(word,'\\p{Punct}',0) as Punct
    > from    A
    > ;
OK
punct

!
,


?

关于hadoop - 如何仅使用Hive中的regexp_extract函数提取标点符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45532994/

相关文章:

hadoop - 在 Hadoop 集群中安装 Cassandra

hadoop - 什么时候我们不应该在配置单元中使用分桶?

hadoop - Hive 和 Impala 以及它们与 HDFS 的交互

hadoop - 更新Hive表中的值

sql - hive 查询 Json 喜欢或等于的地方

string - 如何在映射器中将字符串作为值传递?

hadoop - 这是对 HBase 的合适(或可能)使用吗?

python - 我无法在Hadoop集群中执行mapreduce作业

arrays - 如何使用 json 对象数组创建外部配置单元表

python - 如何使用python加载Hive表?