hadoop - 如何读取.orc文件中的表格配置单元?

标签 hadoop hive orc

我有一个.orc文件,有没有办法将其转换为.csv文件?还是有其他方法可以读取此文件中的表?

最佳答案

Hive具有本地ORC支持,因此您可以直接通过Hive读取它。

插图:

(也就是说,该文件名为myfile.orc)

将文件上传到HDFS

hadoop fs -mkdir hdfs:///my_table_orc_file
hadoop fs -put myfile.orc hdfs:///my_table_orc_file

在其上创建一个Hive表

(更新列定义以匹配数据)
CREATE EXTERNAL TABLE `my_table_orc`(
  `col1` string,
  `col2` string)
STORED AS ORC
LOCATION
  'hdfs:///my_table_orc_file';

查询
select * from my_table_orc;

关于hadoop - 如何读取.orc文件中的表格配置单元?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50364885/

相关文章:

java - 为什么我在 hadoop 的 mapreduce 中得到 3xx 重复项?

hadoop - 如何在 HIVE 中从长结构到宽结构?

hadoop - 有人可以向我解释 orcfiledump 的输出吗?

hadoop - 将以 orc 格式存储的 Hive 表从本地 HDFS 传输到 Google Cloud Storage

java - 如何将hadoop文件导入intelliJ?

mysql - 如何在 Hive 中进行配对?

hadoop - 分桶在 hive 中不起作用

hadoop - 使用 hive/sql 和 spark 读取 json 键值

hadoop - ORC Hive Create Table 错误与位置

java - hive : How to flatten an array?