java - 从MapReduce程序读取xls文件

标签 java hadoop mapreduce

我需要读取保存在 Hadoop 集群上的 XLS 文件。我需要使用 JAVA 的 MapReduce 编程模型来解析该文件。 请在这方面帮助我。

提前致谢

最佳答案

我相信你有两个选择:

  • 编写您自己的可读取 Excel 文件的自定义 InputFormat
  • 从电子表格生成 CSV 或 TSV 文件并使用 TextInputFormat

关于java - 从MapReduce程序读取xls文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20795397/

相关文章:

algorithm - 使用 MapReduce 进行深度优先搜索

java - 无法写入本地 HDFS 数据节点

hadoop - Hadoop如何决定不。给定方案的 reducer 运行?

hadoop - 从 Windows 使用 Java 访问 HDFS

java - Spring Data JpaRepositories 的 LazyInitializationException

java - 使用 Spring MVC 和 Hibernate 进行 Ajax 调用

java - 线程 "AWT-EventQueue-0"中的异常来自 ComboBox 的 java.lang.NullPointerException

java - Hadoop map reduce 从 csv 格式的 csv 文件中提取特定列

MongoDB。 Map-Reduce finalize 函数

java - 有ConcurrentHashMap为什么还要synchronizedMap()?