java - 如何使用 Hadoop Mapreduce 将 EBCDIC 转换为 TEXT

标签 java hadoop mapreduce ebcdic recordreader

我需要解析 EBCDIC 输入文件格式。使用 Java，我可以像下面这样阅读它:

InputStreamReader rdr = new InputStreamReader(new FileInputStream("/Users/rr/Documents/workspace/EBCDIC_TO_ASCII/ebcdic.txt"), java.nio.charset.Charset.forName("ibm500"));

但是在 Hadoop Mapreduce 中，我需要通过 RecordReader 进行解析，但到目前为止还没有工作。

谁能提供解决这个问题的方法吗？

最佳答案

您可以尝试通过 Spark 解析它，也许可以使用 Cobrix这是 Spark 的开源 COBOL 数据源。

关于java - 如何使用 Hadoop Mapreduce 将 EBCDIC 转换为 TEXT，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34869138/

上一篇：java - 从 oracle 数据库获取给定经度和纬度的酒店详细信息

下一篇：java - 从路径中搜索并获取要执行的 jar

java - C++ 指针指向 Java 中的指针

hadoop - docker 中的 yarn - __spark_libs__.zip 不存在

hadoop - 使用 CACHE_THROUGH 将数据写入 alluxio 失败

java - MapReduce IOException

java - 当使用随机种子时，SecureRandom 是否会减弱？

java - 无法获取 getResponseCode

hadoop - Oozie 输出事件

java - 使用 hadoop 的 Apache Tez 配置

hadoop - 为什么增加集群数量可以加快 Hadoop MapReduce 中的查询速度？