image - hadoop 上的并行图像处理

我有几个巨大的 TIFF 图像(60,000x60,000 ~600MB)。我想使用 Hadoop 为每个图像创建一个金字塔(深度缩放格式)并将它们存储在 HDFS 上。理想情况下，我想实现每个节点只处理图像的一部分。

实现它的最佳方法是什么？在 HDFS 上存储小文件会不会有很大的开销？

最佳答案

你确定你需要hadoop吗？你的图像不是那么大。我用了 6 年的台式机可以在 4 分钟内对更大的图像进行深度缩放:

$ tiffinfo huge.tif
TIFF Directory at offset 0x12d095e4 (315659748)
  Image Width: 91460 Image Length: 51866
  Tile Width: 512 Tile Length: 512
  Resolution: 10, 10 pixels/cm
  Bits/Sample: 8
  Compression Scheme: JPEG
...
$ time vips dzsave huge.tif x
real  3m40.841s
user  4m57.587s
sys   0m50.375s

关于image - hadoop 上的并行图像处理，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11395072/

上一篇：java - 相当于 mongo 的输出 :reduce option in hadoop

下一篇：运行 start-all.sh 时出现 hadoop ClassNotFoundException

相关文章：

image - 使用查询将图像插入 postgres 数据库

hadoop - Oozie 将文件从一个 hdfs 位置复制到另一个

java - Hive/Hadoop 中的唯一 key 生成

android - 生成图 block 的更好方法

android - 从图库中点击选择多张图片

javascript - 无法将最后两张图像居中，第一张图像被夸大了

hadoop - HBase 是否稳定且可用于生产？

java - SpringMVC 3 和 Tiles 2 页面标题的本地化

java - @SessionTarget， hibernate session 为空

jquery - CSS3 slider 重新排列图像位置