我的本地机器上有一个 ORC 文件,我需要它的任何合理格式(例如 CSV、JSON、YAML 等)。
如何将 ORC 转换为 CSV?
最佳答案
java
文件夹并执行 maven:mvn install
这就是我使用它们的方式 - 您可能需要调整路径:
java -jar ~/.m2/repository/org/apache/orc/orc-tools/1.5.4/orc-tools-1.5.4-uber.jar data ~/your_file.orc > output.json
输出为 JSON Lines这很容易转换为CSV。首先,我需要从输出中删除最后两行。然后:
import pandas as pd
df = pd.read_json('output.json', lines=True)
df.to_csv('output.csv')
关于csv - 如何将本地 ORC 文件转换为 CSV?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54482815/