python - django 应用程序的网络爬虫;我应该用 django 编写还是作为单独的脚本编写

标签 python django web-crawler

我有 Django 应用程序只是为了一些日常数据的 CRUD。
模型只有价格和日期。

我应该编写一些代码来自动(每天)向我的模型插入新数据。

我打算使用 BeautifulSoup用于网页解析。

所以我有几个问题:

  1. 我计划使用 crontab(使用 crontab -e 手动编辑)将任务设置为每天运行一次。有没有更聪明的解决方案?

  2. 我应该使用 Django ORM 还是只在单独的脚本中编写 SQL?

我正在寻找从长远来看更好的建议。我将有更多这样的任务。

谢谢

最佳答案

如果您已经在 Django 中为您的模型构建支持代码,并将在安装您的应用程序的同一台服务器上运行代码,那么您可能应该使用 Django ORM。

请参阅此页面以帮助开始编写在 Django 应用程序上下文中运行的命令行管理实用程序:

关于python - django 应用程序的网络爬虫;我应该用 django 编写还是作为单独的脚本编写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16932820/

相关文章:

python - 如何在 Web 应用程序(Google、Facebook、Twitter)中管理多个身份验证服务

python - 计算每个月的支出金额,这取决于另一个列值 ID

python - 为什么我的模型同时具有较低的 MAE 和较低的 R2 分数?

python - Django 电子商务中的 URL 安全

java - 从网站爬取数据

python - 我在哪里调用 Keras 中的 BatchNormalization 函数?

Django-taggit。模型中的多个标签。检索数据

python - 如何在 Django 用户模型中保存时执行代码?

node.js - NodeJS 网页抓取 - 表单提交

javascript - 请求返回的结果少于我的爬网程序中页面实际的结果