hadoop - 使用Column header 读取CSV并将其加载到配置单元表中

标签 hadoop mapreduce hive apache-pig cloudera

我有csv文件，文件内有列标题。
例如

列1列2列3
值1值2值3
值1值2值3
值1值2值3
值1值2值3

现在，我想在内部使用此 header 创建配置单元表，然后将没有 header 行的整个表加载到表中。
任何人都可以建议在这种情况下应采取什么方法。

最佳答案

您可以指定

tblproperties ("skip.header.line.count"="1");

看到这个问题(Hive External table-CSV File- Header row)

关于hadoop - 使用Column header 读取CSV并将其加载到配置单元表中，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21514067/

上一篇：hadoop - Hadoop 2中的JobHistory服务器无法从HDFS加载历史文件

下一篇：eclipse - 如何将hadoop mapreduce导入Eclipse以进行开发

相关文章：

hadoop - 如果他有权访问 HDFS 中的表文件，那么对表没有 Sentry 权限的用户如何执行查询？

hadoop - 为什么cloudera 5.12 vm中的默认复制因子为1，而先前版本中的默认复制因子为3？

mapreduce - Ambari HDP 在提交 mapreduce 作业时为 mapreduce.tar.gz 抛出 FileNotFoundException

mongodb map reduce教程

hadoop - 当我运行WordCount示例时，输出文件夹不包含任何输出

hadoop - Hive:有条件地截断并加载表

hive - Beeline 无法在 kerberized 集群中运行 hivescript

hadoop - hadoop是否并行创建输入拆分

hadoop - Jcascalog 查询 HDFS 上的 thrift 数据

r - 在Hadoop上运行wordcount R示例代码时出错

©2024 IT工具网联系我们