hadoop - 使用Column header 读取CSV并将其加载到配置单元表中

标签 hadoop mapreduce hive apache-pig cloudera

我有csv文件,文件内有列标题。
例如

列1列2列3
值1值2值3
值1值2值3
值1值2值3
值1值2值3

现在,我想在内部使用此 header 创建配置单元表,然后将没有 header 行的整个表加载到表中。
任何人都可以建议在这种情况下应采取什么方法。

最佳答案

您可以指定

tblproperties ("skip.header.line.count"="1");

看到这个问题(Hive External table-CSV File- Header row)

关于hadoop - 使用Column header 读取CSV并将其加载到配置单元表中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21514067/

相关文章:

hadoop - 如果他有权访问 HDFS 中的表文件,那么对表没有 Sentry 权限的用户如何执行查询?

hadoop - 为什么cloudera 5.12 vm中的默认复制因子为1,而先前版本中的默认复制因子为3?

mapreduce - Ambari HDP 在提交 mapreduce 作业时为 mapreduce.tar.gz 抛出 FileNotFoundException

mongodb map reduce教程

hadoop - 当我运行WordCount示例时,输出文件夹不包含任何输出

hadoop - Hive:有条件地截断并加载表

hive - Beeline 无法在 kerberized 集群中运行 hivescript

hadoop - hadoop是否并行创建输入拆分

hadoop - Jcascalog 查询 HDFS 上的 thrift 数据

r - 在Hadoop上运行wordcount R示例代码时出错