Azure 中的 Python Web Scraper

标签 python azure web-scraping azure-functions azure-webjobs

我几乎没有用 python 编写的网络抓取工具来从电子商务网站抓取数据。 我想在 Azure 上运行这些脚本。 最好的出路是什么?我正在研究 Azure 函数和 Azure Webjobs,因为我希望有一个自动计划来触发我的脚本。 考虑到要抓取的数据量巨大,Azure Functions 会不会是一件成本高昂的事情? 为了完成这项工作,网络作业的可扩展性如何? 还有其他成本有效的方法来完成任务吗? (我是 Azure 新手)。

最佳答案

您可以尝试使用 Selenium 和 HTTP 触发器进行网络抓取

消费套餐和高级套餐的Azure功能费用,您可以引用Azure Functions pricingReddit/Azure:Azure hosted Web Scraper, good or bad idea?

您可以引用Run Selenium on azure functions , How to create a Selenium web scraper in Azure Functions , Running webscraping Python file with HTML trigger on AzureCreate a Website Scraper for Azure Functions

关于Azure 中的 Python Web Scraper,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68987418/

相关文章:

python - 尝试登录已登录的应用程序 Django 时 CSRF 验证失败

azure - 通过 AzureAD 的 powershell 更新用户电子邮件地址

javascript - 从网站上读取信息并存储在 excel 文件中

javascript - Python Beautifulsoup 抓取包含 Javascript 的页面

javascript - 使用js生成Azure blob存储sas token

node.js - .wait() nightmare 和 Puppeteer evaluate 都找不到 ID

python - 如何直接访问SQLite数据库删除alembic_version表?

python - 无法在 rmarkdown 中导入 python 模块

python - 减去行数不相等的数据帧

Azure CLI 错误 json : cannot unmarshal array into Go value of type unstructured. 检测器