python - 使用 Python 模拟浏览器资源扩展行为

标签 python html http scrapy web-scraping

我正在寻找一种模拟浏览器资源扩展行为的方法。

我试图解决的流程如下:

  • 访问初始网址(例如 http://example.dmn/index.htm)
  • 解析收到的 html 响应(例如index.htm)
  • 查找浏览器通过索引解析获取的资源,例如:
    • 图片
    • 闪光
    • 嵌入视频/音频
    • 框架/iFrame
  • 对找到的每个新资源递归地重复该过程

我不希望跟踪链接 (href),只跟踪首次访问页面时浏览器自动获取的页面资源。

您对如何执行此模拟有什么建议吗?

是否有任何可以提供帮助的 Python 项目/库?

谢谢

最佳答案

您不妨查看Windmill Testing Framework它允许您使用 Python 为 Web 应用程序编写测试。

关于python - 使用 Python 模拟浏览器资源扩展行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3044005/

相关文章:

python - Boto3 - 等待 AWS 数据库迁移任务被删除

Java:WAITING从另一台服务器接收值(通过http?)

python - 如何在 DataFrame 列中匹配 'key off' 对

html - 如何在angular4中使用来自node_modules的svg图标集包?

php - 使用 .htaccess 保护 HTML 文件

jquery - 向 html 元素添加事件

jquery - 当 json 字符串中有 & 登录时,http post 请求中的数据中断

java - 在 Java 中通过 Socket 处理 POST 请求

python - 有没有办法使用 Pandas 删除一行、更改文件、删除下一行、更改文件等等?

python - 为什么 Blender 没有检测到来自 Anaconda 的 python 包?