我有一个包含约一千个不同列的csv文件,我希望将其制作为Hive表和HCatalog模式,而无需分别键入每个字段。如果可以的话,有人可以指出正确的方向,谢谢。
最佳答案
我更喜欢使用Java程序解决此问题。请确保CSV文件 header 是配置单元或hcatalog表的必需列... Java随附CSVReader,它可以读取CSV文件的 header 。将这些 header 添加到数组列表中。可以使用JDbc或Webhcat在hive和hcatalog上创建表。对于jdbc,在添加表列的同时迭代列表。 webhcat也可以采用相同的方法。
关于hadoop - 从文件创建HCatalog模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22627902/