java - 如何使用 Hadoop Mapreduce 将 EBCDIC 转换为 TEXT

标签 java hadoop mapreduce ebcdic recordreader

我需要解析 EBCDIC 输入文件格式。使用 Java,我可以像下面这样阅读它:

InputStreamReader rdr = new InputStreamReader(new FileInputStream("/Users/rr/Documents/workspace/EBCDIC_TO_ASCII/ebcdic.txt"), java.nio.charset.Charset.forName("ibm500"));

但是在 Hadoop Mapreduce 中,我需要通过 RecordReader 进行解析,但到目前为止还没有工作。

谁能提供解决这个问题的方法吗?

最佳答案

您可以尝试通过 Spark 解析它,也许可以使用 Cobrix这是 Spark 的开源 COBOL 数据源。

关于java - 如何使用 Hadoop Mapreduce 将 EBCDIC 转换为 TEXT,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34869138/

相关文章:

java - 取消部署 WebLogic 应用程序时自动取消注册 MBean(由 Spring 注册)

java - C++ 指针指向 Java 中的指针

hadoop - docker 中的 yarn - __spark_libs__.zip 不存在

hadoop - 使用 CACHE_THROUGH 将数据写入 alluxio 失败

java - MapReduce IOException

java - 当使用随机种子时,SecureRandom 是否会减弱?

java - 无法获取 getResponseCode

hadoop - Oozie 输出事件

java - 使用 hadoop 的 Apache Tez 配置

hadoop - 为什么增加集群数量可以加快 Hadoop MapReduce 中的查询速度?