我想抓取这个网站: https://studentservices.uwo.ca/secure/index.cfm 但有一个登录系统。我正在尝试在 native Java 应用程序中使用 htmlUnit(以后可能适用于 Android)。但我无法理解如何找到适当的标签以允许用户在我的程序中输入他们的信息。
最佳答案
基本上,有两种方法可以解决此问题:
询问网站维护人员如何以编程方式实现登录。。 (当你这样做的时候,请与他们核实你计划做的事情是否被允许。最好先询问一下,避免给大学管理部门带来麻烦。)
对您使用网络浏览器登录时页面正在执行的操作进行逆向分析。
对页面进行逆向工程的一种方法是查看页面源代码、阅读 HTML 并(尝试)弄清楚当用户单击登录按钮时会发生什么。 (页面的这一部分看起来像一个简单的 HTML 表单...)
如果该方法不能给您答案,请在浏览器中安装和/或启用 Web 开发工具,并使用它们查看您登录时发送的实际 HTTP 请求。
关于java - 如何找到正确的用户名和密码标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22875756/