我正在使用 apache-nutch-2.1
进行抓取。是否可以将爬取的结果转为json?我写了一个java程序来使用apache-nutch-2.1进行抓取。我将如何以 JSON 格式检索爬网结果。这可能是一个愚蠢的问题,但当我用谷歌搜索时。没有相关内容。
如何添加获取爬取结果的json?
最佳答案
您正在寻找的功能已经实现:Nutch-932 retrieve crawl results as JSON
在上面的链接中也有如何使用它的示例。
关于java - Nutch 爬行结果作为 JSON,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17227993/