azure - 如何将 outlook 项目 (.msg) 文件格式附件加载到配置单元表?

标签 azure hadoop hive bigdata azure-hdinsight

首先,我使用的是 Microsoft Azure HDinsight hadoop。

我有 .msg 文件附件(Outlook 的邮件消息格式) 我已经上传到我的 blob 存储,但我无法将它们上传到我创建的表中。有什么办法可以将它们上传到现有表吗?任何建议都会有所帮助。非常感谢您。

最佳答案

Hive 不理解 msg 格式,因此您必须将其作为字符串读取,然后在其上编写查询以从 blob 存储中读取,然后将其插入表中。您可以使用空格作为分隔符和/或使用 Java 或 Python 编写您自己的自定义提取器以将其插入到表中。

关于azure - 如何将 outlook 项目 (.msg) 文件格式附件加载到配置单元表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33783717/

相关文章:

azure - 什么时候 Azure IoT 中心可以优于 IoT Central?

hadoop - Row 格式 serde 是创建 Hive 表时要使用的强制参数吗

hadoop - distcp hdfs和hftp有什么区别,为什么distcp hdfs有效?

apache-spark - Spark Streaming to Hive,每个分区的小文件太多

mysql - 比较来自两个不同数据源(MySQL 和 Hadoop)的数据的有效方法

asp.net-mvc - 向每个 LINQ Select 查询添加 WHERE 子句

asp.net - Azure Application Insights 中报告 window.onerror 处的字符无效; ASP.Net Web 应用程序

hadoop - Hadoop 权威指南的面向列的格式章节中的序列顺序?

asp.net - Azure 网站打开了 login.microsoftonline.com(使用你的工作或学校帐户登录)

java - Hadoop Hbase查询