是否有任何简单、易于启动的 java 工具来可视化来自 map reduce 作业目录的键/值数据?
具体来说,我想浏览一个 20 个作业的 map reduce workflow ,点击单个文件并查看数据,甚至可能看到文件大小的直方图。
这里有一些注意事项,例如 -
- 一些文件有序列化数据(不仅仅是文本)
- 显然,这个系统在“云规模”上使用可能会很愚蠢,而不是一个开发工具。
尽管如此,这样的工具对于开发和本地调试大型连接的 m/r 管道很有用。
这是出于开发目的(我不是试图在真实集群中可视化分布式键/值 hadoop 数据)。
最佳答案
Monitor Job Execution Step-by-Step
- Workflow with Results: Shows the resulting output at each step of the MapReduce job.
- Hadoop Logs from the Desktop: Accesses Hadoop logs easily from the desktop.
- Job Failure Options: Allows the specification of job failure options such as automatic invocation of a specified script upon job failure for EMR.
关于java - Hadoop : Tools for visualizing key value data and files for development,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8771388/