我正在尝试从 url 列表下载 .html 格式的网页,但其中一些网站使用 session cookie,当我尝试 Jsoup.connect("url") 时,我收到 403。
所以,我使用Map/HashMap作为how to manage cookies with Jsoup, maintain cookies and session with Jsoup, retrieve cookies..,但仍然是 403。
真正令我惊讶的是,像 Mac Automator 这样一个非常简单的应用程序就可以完成这项工作,实际上只保存文本而不是 html,但仍然......
有谁知道如何克服 cookies 的挫折?使用此页面的示例会很棒。 http://pubs.acs.org/doi/full/10.1021/ja312087x
谢谢!!!
最佳答案
看看这个答案 https://stackoverflow.com/a/15369631/516167
您需要打开页面,然后发送表单数据(登录名、密码)、cookie 和 POST 所需的其他参数。
关于java - 403 禁止 : Jsoup can't handle session cookies properly?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15327018/