java - 如何在 Java 中获取 HTML

标签 java html screen-scraping

在不使用任何外部库的情况下,将网站的 HTML 内容提取为字符串的最简单方法是什么?

最佳答案

我目前正在使用这个:

String content = null;
URLConnection connection = null;
try {
  connection =  new URL("http://www.google.com").openConnection();
  Scanner scanner = new Scanner(connection.getInputStream());
  scanner.useDelimiter("\\Z");
  content = scanner.next();
  scanner.close();
}catch ( Exception ex ) {
    ex.printStackTrace();
}
System.out.println(content);

但不确定是否有更好的方法。

关于java - 如何在 Java 中获取 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31462/

相关文章:

javascript - Angular Directive(指令) - 自动拉伸(stretch)到底部

python - 使用 Scrapy 登录 Facebook 时出现问题

javascript - 需要 JavaScript 支持的网页抓取网站

java - 如何跳过格式正确性检查 XML

java - 为一个方法编写单元测试,该方法调用java中同一类的其他私有(private)方法。如何模拟私有(private)方法

java - 将数据从 jsp 迭代器发送回 struts 操作类

java - 发布视频时总是提示视频格式不受支持

html - CSS - 如何正确实现基于表单输入的图像

html - 如何绝对定位一组元素?

screen-scraping - 如何截取指定网站的截图?