python - Pydoop vs Mrjob在Hadoop上进行图像处理

标签 python hadoop image-processing

我想在 Hadoop 平台上处理图像(最有可能是大尺寸的图像),但是我对于从上述2个界面中选择哪一个感到困惑,特别是对于仍然是Hadoop初学者的人。考虑到需要将图像分成块以在工作机之间分配处理并在处理完成后合并这些块。
众所周知, Pydoop 可以更好地访问Hadoop API,而 mrjob 具有用于执行作业的强大实用程序,哪种工具适合用于此类工作?

最佳答案

我实际上建议pyspark,因为它本身支持二进制文件。

对于图像处理,您可以尝试TensorFlowOnSpark

关于python - Pydoop vs Mrjob在Hadoop上进行图像处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60469567/

相关文章:

hadoop - 如何解决在Windows 10中的Eclipse中执行map-reduce java代码时遇到的问题?

algorithm - SURF 算法的输出到底是什么?我如何使用它们进行分类(SVM 等)?

python - 使用 OpenCV 检测图像上的 Blob

python - 有没有类似Python JoinableQueue的东西?

python - 带有 Eclipse 的 TensorFlow

python - 更改 sys.stdin 模式

c++ - 空结构元素的 OpenCV 腐 eclipse /膨胀错误输出?

python - 从 matplotlib 导入地理图到 plotly

hadoop - hadoop中需要迭代的一个很好的例子

logging - Hadoop中日志文件的含义