hadoop - 在 hadoop Map reduce 中读取带有工作表的 Excel 文件

标签 hadoop

我有一个 excel 文件,在一个文件中包含大约 20 张纸。 我想通过 hadoop 中的 map reduce 程序读取它。任何人都可以帮助我解决这个问题。 请建议我如何阅读它...

提前致谢。

最佳答案

您可能会发现 Apache Tika库可用于您的映射器以解析您的 Excel 文件。

关于hadoop - 在 hadoop Map reduce 中读取带有工作表的 Excel 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28848241/

相关文章:

hadoop - UIMA DUCC 与 Hadoop 上的 UIMA

hadoop - 来自AVRO文件的外部Hive表说它没有数据

hadoop - 从不同用户的 eclipse 提交 oozie 作业?

hadoop - Mahout K表示聚类输入文件格式

hadoop - 有人可以解释我们注意到的独特的协处理器执行行为吗?

hadoop - 运行./hcat_server.sh start时未找到hadoop

java - 在 Java 程序中从 Unix 路径读取一个 hadoop 配置文件

hadoop - Pig的新功能:错误1066,Pig版本0.17.0 Hadoop版本3.1.0

hadoop - Apache pig : Calculate number of days between a date and current date

java - hadoop 和 yarn 的 Maven 依赖项