我正在编写一个应用程序,试图确定页面上是否有广告。目前正在使用 python 通过 selenium webdriver 使用浏览器驱动。
我发现 iframe 中存在大量广告,我制作了一个循环来查看每个框架
browser = webdriver.Chrome()
browser.get("http://cnn.com")
all_iframes = browser.find_elements_by_tag_name("iframe")
for iframe in all_iframes:
browser.switch_to_frame(iframe)
print(browser.page_source)
browser.switch_to_default_content()
browser.quit()
我想知道是否有任何可以在多个页面上使用的始终找到的标记或标记参数,以确定页面上是否有广告(页面上的 iframe 内部和外部)。我是否必须在每个框架内查找诸如 doubleclick、adtech 或 adblade 之类的实例?
或者我是否必须针对每页生成不同的检查规则?
有人了解广告在网页上的显示方式吗?谢谢。
最佳答案
您可以按广告服务器进行搜索。
http://pgl.yoyo.org/as/serverlist.php?hostformat=adblockplus
查看其他项目并了解他们如何处理相同的任务会很有帮助:
关于javascript - 在网页上查找广告,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13423219/