一行数据看起来像
"!Next?" (1994) Italy
我需要创建3列。
""
中的电影的名称()
附带的发行日期我需要为每列指定不同的分隔符。
重要的一件事-我正在从文件
/home/ap/Downloads/country.list
加载数据如果可以解释一下一些查询,那就太好了。
提前致谢...
最佳答案
使用这个命令
cat YOUR_FILE_HERE|sed 's/"\(.*\)"\s*(\(.*\))\s*\([^\s].*\)/\1^A\2^A\3/g' > OUTPUT_FILE
然后将此OUTPUT_FILE加载到您的配置单元表中。
记得:
我在这里使用
\001
作为分隔符。如果您更改表的默认字段终止符,请使用它替换我的cmd中的^A
。而且
^A
也由ctrl-v
输入,然后由ctrl-a
而不是^
和A
输入。
关于hadoop - 如何为Hive中的不同列指定其他定界符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29427978/