java - 如何在 Java 中获取 HTML

在不使用任何外部库的情况下，将网站的 HTML 内容提取为字符串的最简单方法是什么？

最佳答案

我目前正在使用这个:

String content = null;
URLConnection connection = null;
try {
  connection =  new URL("http://www.google.com").openConnection();
  Scanner scanner = new Scanner(connection.getInputStream());
  scanner.useDelimiter("\\Z");
  content = scanner.next();
  scanner.close();
}catch ( Exception ex ) {
    ex.printStackTrace();
}
System.out.println(content);

但不确定是否有更好的方法。

关于java - 如何在 Java 中获取 HTML，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31462/

上一篇：java - 文件路径 Windows 格式转 java 格式

下一篇：java - 错误 : 'F' is not a valid file-based resource name character: File-based resource names must contain only lowercase a-z, 0-9，或下划线

python - 使用 Scrapy 登录 Facebook 时出现问题

javascript - 需要 JavaScript 支持的网页抓取网站

java - 如何跳过格式正确性检查 XML

java - 为一个方法编写单元测试，该方法调用java中同一类的其他私有(private)方法。如何模拟私有(private)方法

java - 将数据从 jsp 迭代器发送回 struts 操作类

java - 发布视频时总是提示视频格式不受支持

html - CSS - 如何正确实现基于表单输入的图像

html - 如何绝对定位一组元素？

screen-scraping - 如何截取指定网站的截图？