java - 使用 HTMLUNIT 从本地 html 文件读取 html

标签 java web web-crawler htmlunit

我正在尝试加载我已下载的本地 html 文件。有人知道怎么做这个吗?我目前正在获取状态代码[404]。

我就是这样做的

HtmlPage htmlPage=webClient.getPage("file:\\\\Users\\njd202\\Desktop\\zipmeupbich\\springbootmongodb\\src\\main\\resources\\downloadedfiles\\Cuban2.html") ;

最佳答案

在这里做了一个简短的测试,它对我来说效果很好。

webClient.getPage("file:\\\\C:\\Users\\me\\Desktop\\htmlunit\\test.html"

请检查您是否是

  • 使用最新的 HtmlUnit 版本
  • 使用正确的路径
  • 从一个包含非常简单的 html 内容的文件开始(无外部链接/引用)

关于java - 使用 HTMLUNIT 从本地 html 文件读取 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50314123/

相关文章:

Java - 转储到 XML

java - 降低音乐质量(320 kbps 至 64 kbps)

css - 图像按钮在 Firefox 中的图像顶部显示 'Submit query'

java - 关于 JCS 的信息

javascript - Firebase 无法获取我的身份验证输入值

javascript - 按后退按钮时忽略重定向页面

java - 文件没有嵌入样式表指令

c# - HTML文本分析

java - 如何从 AngelList API 获取公司

java - 抛出异常的问题