我想在我的 java 应用程序中使用 Nutch API 从网站抓取 pdf 链接进行分析,我如何在我的 java 应用程序中使用 Nutch jar 来做到这一点?我可以举个例子吗?
最佳答案
首先,您需要通过下载并解压缩 Nutch,然后通过给出命令来将 Nutch 作为服务器运行,
bin/nutch startserver
之后,您可以在 Java 中使用 RestTemplate 等 REST 客户端并调用所需的 API。以下是 Nutch 提供的所有 REST API 的文档。
https://wiki.apache.org/nutch/Nutch_1.X_RESTAPI/RunningJobsTutorial
关于java - 如何将 Nutch API 用于 java 应用程序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26729016/