我开发了一个应用程序,使用 Java 和 selenium 从用户给定的 URL 中提取 Google 广告。我只能使用 HTML 标记提取 Google 广告。但它经常变化。有任何其他解决方案或任何 API 可用于此目的吗?
最佳答案
对于网页抓取,网站所有者可以随时更改 DOM,并且代码可能会失败。
您能做的最好的事情就是编写一个定期运行的测试并验证所有 DOM 依赖项的运行状况,然后您可以在发生更改时发出警报邮件。
我们还采取了另一种方法(虽然是针对 gmail),这可能不适用于您的用例,我们假设登录用户将始终保持不变,并且我们尝试为常量登录用户邮件查找 HTML/DOM 选择器,然后我们能够编写一些逻辑来动态查找依赖元素的 DOM/CSS 选择器,这有助于缓解问题,但是,很难为此类用例编写完整的解决方案
关于javascript - 使用 Java 和 Selenium 库从网站中提取 Google 广告,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33057388/