regex - Hive 如何使用 < 和 > 符号处理正则表达式?

标签 regex hadoop hive

我是 siva Ramanjaneyulu,我正在研究 hive 。我遇到了配置单元的以下问题

示例日志:<ABC>

CREATE TABLE sample4(  num1 STRING ) ROW FORMAT SERDE
'org.apache.hadoop.hive.contrib.serde2.RegexSerDe' WITH
SERDEPROPERTIES ( "input.regex" = "<.*>", "output.format.string" =
"%1$s" ) STORED AS TEXTFILE; 

LOAD DATA LOCAL INPATH "../hive-0.9.0/sample.log" INTO TABLE sample4; 

select * from sample4;

NULL

预期输出:ABC

为什么这 .RegexSerDe不适用于正则表达式 <.*>

如何使用正则表达式删除 < 和 > 符号,你能提供解决方案吗

最佳答案

试试这个:

hive> CREATE TABLE s(num1 STRING) ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe' WITH SERDEPROPERTIES ( "input.regex" = "(<.*>)", "output.format.string" = "%1$s" ) STORED AS TEXTFILE;

注意正则表达式周围的括号

关于regex - Hive 如何使用 < 和 > 符号处理正则表达式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17379239/

相关文章:

正则表达式未正确匹配字符串

hadoop - 如何设置 Hive reduce 运算符,因为 reduce 运算符始终为 0

hadoop - 失败 : semanticexception the current builtin authoization in hive is incomplete and disabled

performance - Syncfusion仪表板平台:如何快速创建仪表板?

hadoop - 使用带有 kerberos 的配置单元 Metastore 服务器的 oozie 配置单元操作

apache-spark - 如何向通过 Spark 创建的 View 添加注释

java - 用整数替换所有变量

regex - Excel VBA - 从剪贴板返回字符串中所有子字符串的位置

python - 使用 Python 查找源代码中不在注释内的所有字符串

hadoop - Mapreduce XML 输入格式 - 构建自定义格式