我正在尝试抓取网站“http://www.daxontech.com” 如果我们在网络浏览器中输入上述地址,地址会自动更改为 http://www.benqmaterials.com/index.aspx
我尝试使用响应代码将我的程序重定向到上述网站,但响应代码是 200。有没有办法检索上述地址。我正在使用 Jsoup 进行爬网。 提前致谢。
最佳答案
您引用的站点使用元重定向,该重定向在 header 发送到客户端后完成。
<meta http-equiv="refresh" content="0; url=http://www.BenQMaterials.com/index.aspx">
这是您正在抓取的网站的错误,如果不解析页面中的 html 以获取元刷新标签(或其他类似的重定向方法),您可能无能为力
关于http - 网站重定向到新地址但不发送 3XX 代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20968869/