javascript - 在网页上查找广告

标签 javascript python html ads selenium-webdriver

我正在编写一个应用程序,试图确定页面上是否有广告。目前正在使用 python 通过 selenium webdriver 使用浏览器驱动。

我发现 iframe 中存在大量广告,我制作了一个循环来查看每个框架

browser = webdriver.Chrome()
browser.get("http://cnn.com")

all_iframes = browser.find_elements_by_tag_name("iframe")

for iframe in all_iframes:
   browser.switch_to_frame(iframe)
   print(browser.page_source)
   browser.switch_to_default_content()

browser.quit()

我想知道是否有任何可以在多个页面上使用的始终找到的标记或标记参数,以确定页面上是否有广告(页面上的 iframe 内部和外部)。我是否必须在每个框架内查找诸如 doubleclick、adtech 或 adblade 之类的实例?

或者我是否必须针对每页生成不同的检查规则?

有人了解广告在网页上的显示方式吗?谢谢。

最佳答案

您可以按广告服务器进行搜索。

http://pgl.yoyo.org/as/serverlist.php?hostformat=adblockplus

查看其他项目并了解他们如何处理相同的任务会很有帮助:

http://adblockplus.org/en/source

关于javascript - 在网页上查找广告,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13423219/

相关文章:

html - oninput()在选择上不起作用

javascript - JSF 2.0 - 在 URL 中包含带符号的脚本标记

javascript - 如何从 ionic 2 中的服务器响应获取 header 数据

javascript - 如何通过 Firebug 仅重新加载脚本

python - 在Python中将数据框Json列展平为新行

python - 如何更改 pandas 中的时间格式?

Javascript 宏 : implementing F# style forward pipe operator

Python:如何创建 for 循环来更改 dict 值并将其附加到列表中?

javascript - 如何在不调整主要内容边距的情况下设置可折叠的侧边导航?

html - 字体嵌入不起作用