python - 使用 Python 模拟浏览器资源扩展行为

标签 python html http scrapy web-scraping

我正在寻找一种模拟浏览器资源扩展行为的方法。

我试图解决的流程如下:

访问初始网址(例如 http://example.dmn/index.htm)
解析收到的 html 响应(例如index.htm)
查找浏览器通过索引解析获取的资源，例如:
- 图片
- 闪光
- 嵌入视频/音频
- 框架/iFrame
对找到的每个新资源递归地重复该过程

我不希望跟踪链接 (href)，只跟踪首次访问页面时浏览器自动获取的页面资源。

您对如何执行此模拟有什么建议吗？

是否有任何可以提供帮助的 Python 项目/库？

谢谢

最佳答案

您不妨查看Windmill Testing Framework它允许您使用 Python 为 Web 应用程序编写测试。

关于python - 使用 Python 模拟浏览器资源扩展行为，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3044005/

上一篇：java - 在 Java 上对服务器进行 http 查询的有效方法

下一篇：http - 通过 http 上传的文件包含哪些信息？

相关文章：

python - Boto3 - 等待 AWS 数据库迁移任务被删除

Java:WAITING从另一台服务器接收值(通过http？)

python - 如何在 DataFrame 列中匹配 'key off' 对

html - 如何在angular4中使用来自node_modules的svg图标集包？

php - 使用 .htaccess 保护 HTML 文件

jquery - 向 html 元素添加事件

jquery - 当 json 字符串中有 & 登录时，http post 请求中的数据中断

java - 在 Java 中通过 Socket 处理 POST 请求

python - 有没有办法使用 Pandas 删除一行、更改文件、删除下一行、更改文件等等？

python - 为什么 Blender 没有检测到来自 Anaconda 的 python 包？

©2024 IT工具网联系我们