image - Hadoop InputSplit 之间是否重叠?

标签 image image-processing hadoop

我正在做一项 Hadoop 工作,对一个或多个可能非常大的 PGM 文件进行卷积。每个映射器将处理来自其中一个文件的一定数量的行,并且缩减器将文件重新组合在一起。但是,每个映射器都需要在其进行卷积的上下几行。通常这不是问题,因为我创建了一个 RecordReader 来获得这种冗余,但它对 InputSplit 的第一行和最后一行提出了一个问题,因为我无法访问上次拆分的行。

有什么方法可以使 InputSplits 重叠,以便第一行的最后几行是第二行的前几行?

最佳答案

您可以编写自己的自定义拆分器。参见 this post通过史蒂文·刘易斯

关于image - Hadoop InputSplit 之间是否重叠?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16110747/

相关文章:

java - Hadoop 配置 - 集群

hadoop - 无法在 hdfs NameNode 中创建目录处于安全模式

html - 折扣徽章,按钮和文字的简单HTML CSS代码

python-2.7 - 使用 skimage 并排绘制两个图像

Hadoop 计算所有拆分中所需的术语

matlab - 在matlab中提取区域

python - 计算红色像素值并在 Python 中绘制直方图

iPhone 存储远程服务器图像

c# - WinRT XAML 上的 Image.OpacityMask

javascript - 如何在 View MVC 中更改 img src