hadoop - 与Hive中的其他文件一起处理xml文件

标签 hadoop hive

我需要将3个文件加载到配置单元中,从db2中加载1个文件,从mysql中加载第二个文件,第三个是XML,然后在配置单元中对其进行处理。
我有db2和mysql文件。但是如何将 hive 中的xml文件与其他具有相同格式的文件一起加载。
我的解决方案是先用PIG处理它,然后将其转换为CSV格式,然后再处理。

我可以直接将 hive 中的XML文件以CSV格式加载到一起处理所有数据吗?
感谢您的回复

最佳答案

您可以使用XPathUDF,查看here了解更多信息

关于hadoop - 与Hive中的其他文件一起处理xml文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20730355/

相关文章:

hadoop - TEZ的Hive索引

hadoop - Hive 是否支持基于表达式的分区?

hadoop - 为什么我在安装 HDinsight 后运行了多个 Java 实例?

sql - Hive 和 Pig 中的不平等加入

sql - 选择配置单元中的下一个非空字段

java - 首先按值然后按键对 JavaPairRDD 进行排序

hadoop - 如何在Hadoop 1.x中实现Namenode高可用性?

java - 如何从字符串中删除换行符和空行

apache-spark - 在命令提示符下使用Hadoop

hadoop - Hive:将字符串转换为 bool 值