我正在尝试抓取网络。最好用 Nutch。 如果开箱即用的 Hortownworks 支持 Nutch,则没有找到引用。
有没有专门用 Hortonworks HDP 集成 Nutch on YARN 的? 或者有人尝试在 Hadoop 2.x (YARN) 上集成 Nutch?
提前致谢。
最佳答案
HDP 2.3 不支持开箱即用的 Nutch(HDP 网站上有一张图表显示支持的服务:HDP2.3 What's New)。但是它确实支持 Nutch 所依赖的服务。可以定义自定义 Ambari 服务并将其添加到 HDP 2.3 堆栈定义中以启用对 Nutch 的支持。
关于hadoop - 在 Hortownworks 或 YARN 上集成 Nutch,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29007040/