我需要使用 Java 解析以下行,该行是由 Pig 组函数生成的。
(D1,{(A1,null,C1,D1,E1),(null,B1,C1,D1,E1),(A2,null,null,D1,E2)})
这里 D1 是键,(A1,null,C1,D1,E1),(null,B1,C1,D1,E1),(A2,null,null,D1,E2)
是对应的值。
我正在寻找一个java pgm来仅保留值。但是,不能直接应用“,”上的 split 函数,因为内部元素还包含 , 分隔符。
最佳答案
蹩脚的 DIY 解决方案是首先隔离 "(A1,null,C1,D1,E1),(null,B1,C1,D1,E1),(A2,null,null,D1,E2 )"
,然后将其拆分为 "),("
,这样就得到 "(A1,null,C1,D1,E1"
, "null,B1,C1,D1,E1"
和 "A2,null,null,D1,E2)"
。删除无关的括号,然后用逗号将每个分隔开:你想要的。
关于用于解析使用 Pig 脚本生成的组的输出的 Java 程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21178734/