java - Hadoop 和不同格式的输入,如图像、音频、视频

标签 java linux image hadoop mapreduce

我正在学习 Hadoop 和 MapReduce 框架。到目前为止,我一直在研究文本文件并通过利用 MapReduce 框架来处理它们。

当我开始学习 MapReduce 时,我发现的第一个流行示例是 WORDCOUNT,这是一个文本文件处理场景。 然后我写了自己的逻辑来处理一些文本文件并显示结果。我在那种情况下成功了。

但我需要转向不同格式的输入。因为在现实世界中我们不会只处理文本文件。 我需要探索使用 MapReduce 框架对不同格式(如图像、音频、视频)的处理。 但我正在努力寻找适合我的目的的例子。我需要一些关于 MapReduce 的示例和教程,这些示例和教程具有从文本到视频的不同输入格式。

编辑:

我的意思是处理图像、视频和音频。不仅是文本文件。

编辑 2:

一个例子: 假设我有 10 年的 .bmp 图像(不涉及压缩和解压缩),其大小为 450GB。我需要分析文件夹中的每个图像,我应该显示相似的图像(通过比较像素的相似模式)。我应该列出在“从”“到”日期之间创建/修改的图像。假设在 2013 年 1 月至 2013 年 2 月期间在该图像集中创建/修改的图像。 我怎样才能做到这一点??

如果有人帮助我走在正确的道路上,我会很高兴!!

最佳答案

HIPI是一个使用 MapReduce 对图像文件进行图像处理的框架。

Here是一篇关于云端高性能视频处理的论文。它不完全是 MapReduce,但与 MapReduce 非常相似。

请注意,我没有尝试过它们,但做了一些谷歌搜索,这些是我可以获得的最接近的资源。

关于java - Hadoop 和不同格式的输入,如图像、音频、视频,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15470778/

相关文章:

java - Ubuntu/Spring 3 - 语言环境的奇怪问题

java - 如何在 GridBagLayout 上放置背景图片

php - 如何在 PHP 中的图像中写入阿拉伯文文本

java - JDateChooser 显示语言

java - 从 JDBC MSSQL 获取返回值

java - 从 Applet 使用 JSch 连接到 SFTP 服务器时出现 AccessControlException

linux - 我想在字符串中嵌入单引号

linux - Shell:如何给一个文件指定父目录的名称?

image - 在 html5 中绘制图像/纹理

java - Guava CharMatcher 删除空格保留换行符