python - 如何自动运行爬虫?

标签 python django cron scrapy

我正在使用django和scrapy框架来完成一个项目。在我的项目中,有两个爬虫。现在我希望这些爬虫每天自动运行一到两次。那么我怎样才能做到这一点呢?这是如何实现的?我正在寻找使用 cron 作业的简单想法?因此,我正在寻找一些好的且简单的引用资料来开始。

最佳答案

我认为 cronjob 将是最简单的方法。

只需将以下内容添加到“/etc/crontab”(或使用crontab -e):

0 0 * * * python /path/to/your/script.py

它将在每天 00:00 运行

这里还有一些不错的引用网站:http://www.thesitewizard.com/general/set-cron-job.shtml

编辑:如果您不希望将输出发送到您的邮件,只需使用:

0 0 * * * python /path/to/your/script.py > /dev/null

0 0 * * * python /path/to/your/script.py >/dev/null 2>&1

第一个将“破坏”“正常”输出(但会记录任何错误),第二个将“破坏”任何输出。

关于python - 如何自动运行爬虫?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21548010/

相关文章:

python - 在pyspark中连接单个RDD中的两个字符串以形成新的RDD

python - 如何防止用户在 Django DetailView 中看到不属于自己的数据?

再次使用 Azure Function 和 CRON

ruby-on-rails - 不使用 RVM 时的 Cron +

MySQL 转储 CronJob

python - 给定原始和复杂的一维数据的核估计

python - 创建 KeyStone 实例时 OpenStack KeyStone SSL 异常

python - 在列表中查找特定值的每三个实例

python - Django - 从 View 中为当前用户准备对象

django - 关系不存在,在 PostgreSQL、Django 中