csv - 如何将csv文件加载到配置单元中

标签 csv hadoop hive hiveql

这是我的csv文件

id,name,address

"1xz","hari","streetno=1-23-2,street name=Lakehill,town=Washington"
"2xz","giri","streetno=5-6-3456,street name=second street,town=canada"

我使用行格式定界符“”加载了此数据,但未正确加载,我遇到了地址字段问题。在地址字段中,我有这样的数据格式“streetno = 1-23-2,street name = Lakehill,town =华盛顿“在此地址中的值再次由”,“终止。我在 pig 中找到了一种解决方案,请帮助我使用 hive 解决它。

我正在得到这个输出
 "1xz"   "hari"   "streetno=1-23-2
 "2xz"   "giri"   "streetno=5-6-3456

这是我的图式
create table emps (id string,name string,addresss string ) row format delimited fields terminated by ',' lines terminated by '\n' stored as textfile;

最佳答案

使用split()函数,它返回字符串数组:[0] ='streetno',[1] ='1-23-2':

split(address,'=')[1]  as address --returns '1-23-2'

关于csv - 如何将csv文件加载到配置单元中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40847831/

相关文章:

html - Elm -- 将文本文件解析为 Html

python - 基于 JSON 字典键的 CSV header

mysql - 包含相关数据的非常大的表。什么样的 DBMS 是最佳的,以及如何对其建模?

java - Mapreduce 程序无法读取输入文件

hadoop - Hadoop UI未显示作业选项卡,作业进度和作业历史记录

java - 如何修复 Hive 下运行的 geoip2 java 的 "java.lang.NoSuchMethodError"

hadoop - 如何在 Hadoop Hive 中执行 "Order of Events"查询?

php - symfony 导出 html.twig 到 csv

azure - 我可以缩小Azure HDinsight集群吗?

php - in_array 的问题,返回 false