java - "browse"到页面并用 Java 提交表单的最简单方法

标签 java html web-scraping httprequest headless-browser

我需要做的是浏览到一个网页,登录,然后浏览到该站点上要求您登录的另一个网页,因此需要保存 cookie。之后,我需要单击该页面上的一个元素,我将在其中填写表格并获取网页返回给我的消息。我需要实际转到页面并单击按钮(假设只是直接导航到链接)的原因是因为每次登录并单击链接时都会为您分配一个 session ID,而且它总是不同的。该按钮看起来像这样,它不是一个普通的 href 链接:

<span id=":tv" idlink="" class="sA" tabindex="0" role="link">Next</span>

无论如何,最简单的方法是什么?谢谢。

更新: 在尝试了 HTMLunit 和其他 headless 浏览器库之后,它似乎并没有发生在使用任何“ headless ”的情况下。我最近发现的关于此页面的另一件事是,所有 HTML 都是某种奇怪的格式……它都在一个脚本标签内。这是一个示例。

"?ui\x3d2\x26view\x3dss\x26mset\x3dmain\x26ver\x3d-68igm85d1771\x26am\x3d!Zsl-0RZ-XLv0BO3aNKsL0sgMg3nH10t5WrPgJSU8CYS-KNWlyrLmiW3HvC5ykER_n_5dDw\x26fri"],"http://example.com/?ctx\x3d%67mail\x26hl\x3den",,0,"Gmail","Gmail",[["us","c130f0854ca2c2bb",[["n"],["m","New features!"],["u"],["k","0"],["p","1000:500000,10,200000,5,100000,3,75000,2,0,1"],["h","https://survey.googleratings.com/wix/p1679258.aspx?l\x3d1033"],["at","query,5,contacts,5,adv,5,cf,5,default,20"],["v","https://www.youtube.com/embed/Ra8HG6MkOXY?showinfo\x3d0"],

当我检查按钮上的元素时,我在上面为按钮发布的 HTML 代码会出现,但在查看源代码时不会出现。基本上,我需要做的是使用某种 GUI,让用户导航到链接,然后让程序填写信息。有谁知道我该怎么做?谢谢。

最佳答案

查看 Selenium 5 分钟入门指南:http://code.google.com/p/selenium/wiki/GettingStarted

关于java - "browse"到页面并用 Java 提交表单的最简单方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14740801/

相关文章:

python - selenium python - 无法在表中找到隐藏元素

python - 如何获取li的第二个span标签中存在的第二个 anchor 标签的href。 - BeautifulSoup

java - WebDriver 从页面中删除元素

java - ejb 是否在连接上提交?

java - GWT - 客户端文件上传

html - Slack 中网站的 Favicon 模糊,Slack 的目标图标大小是多少?

java - 禁用 JFileChooser 中的打开按钮?

html - 样式 Bootstrap 事件选项卡

html - 带有图像的导航 ul li

python - 如何使用 python bs4 抓取包含分页下一个标签的股票数据?