java - 如何通过java为给定域生成站点地图有哪些可用的API或源代码

标签 java web-crawler sitemap

嗨,嗯,我对 java 很陌生,我希望在用户进入域时构建一个站点地图生成器。我正在寻找源代码和 API 来执行此操作。如果有人可以提供帮助,我将不胜感激。

最佳答案

您需要下载

JDK 6
sitemapgen4j-1.0.1.jar

示例:

import java.io.File;
import java.net.MalformedURLException;
import java.util.Date;

import com.redfin.sitemapgenerator.ChangeFreq;
import com.redfin.sitemapgenerator.WebSitemapGenerator;
import com.redfin.sitemapgenerator.WebSitemapUrl;

public class SitemapGenerator {

  public static void main(String[] args) throws MalformedURLException {

    WebSitemapGenerator webSitemapGenerator = WebSitemapGenerator.builder("http://www.example.com", new File("C:\\sitemap"))
    .gzip(true).build();

    WebSitemapUrl webSitemapUrl = new WebSitemapUrl.Options("http://www.example.com/test1.html")
      .lastMod(new Date()).priority(1.0).changeFreq(ChangeFreq.HOURLY).build();

    webSitemapGenerator.addUrl(webSitemapUrl);
    webSitemapGenerator.addUrl("http://www.example.com/test2.html");
    webSitemapGenerator.write();
  }
}

了解更多:http://code.google.com/p/sitemapgen4j/

关于java - 如何通过java为给定域生成站点地图有哪些可用的API或源代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11014934/

相关文章:

seo - 如何添加指向 Google 和他的机器人的动态链接

java - 当对同一个 Oracle 数据库进行查询时,JDBC 语句中的 SYSDATE 似乎返回不同的时间

java 继续尝试,直到不再有 filenotfoundException

java - 如何在不强制转换的情况下在具有相同数据类型参数的另一个泛型类(或接口(interface))中使用泛型类(或接口(interface))

python - 用 BeautifulSoup 解析,报错 TypeError : coercing to Unicode: need string or buffer, NoneType found

ruby - 如何避免重复条目抓取网站

java - 具有多种 View 类型的 RecyclerAdapter 中的 IndexOutOfBoundsException

python - 如何使用 Scrapy/Python 从条件下拉字段中获取值?

python - 使用 Scrapy 解析站点地图

node.js - 使用 NodeJS 查找域上的所有页面