阿里云服务器定时在线运行python爬虫代码「建议收藏」

阿里云服务器定时在线运行python爬虫代码「建议收藏」服务器:centos任务管理:cron服务对于cron服务不了解的可以看我这篇文章

大家好,又见面了,我是你们的朋友全栈君。

前言

这是我听老师讲课做的笔记

作者:神的孩子都在跳舞

关注我的csdn博客,更多python知识还在更新

前言:

为了参加计算机设计大赛,我和我的团队做了个数据分析项目,由于涉及到数据的爬取,实时更新等,所以有了这一篇文章

思路:

其实定时爬取并不难,无非就是在linux上跑程序,加上一个时间给它,如果你学过linux那么一定听说过这个cron服务,接下来我们就用它弄个定时任务就可以了

服务器:centos
任务管理:cron服务
环境:python3.7

对于cron服务不了解的可以看我这篇文章cron服务——Linux计划任务管理

使用xshell连接服务器

  1. 我们先查看crontab服务是否开启
    在这里插入图片描述

如果是active说明开启了否则需要start启动

  1. 调用文本编辑器对cron任务进行编辑
crontab -e

定时运行python爬虫文件的设置命令是这样的

分钟 小时 天数 月份 星期 python 运行文件名

由于我的项目已经在服务器上部署好了,项目运行是在虚拟环境下面的,所以我需要进入指定目录和环境

0 0 * * 7 cd /www/wwwroot/RecruitDataVsible-master1 && source ./ccccc_venv/bin/activate && python dataView/数据爬取/总的爬取项目/conten2.py

我这里的意思是每个星期天0点0分(就是晚上12点整)cd进入项目文件,source启动进入环境,使用python命令运行conten2.py这个文件

具体的修改查看命令可以看上面的文章

目前我的项目是这样子的,总共有九个类别的数据
在这里插入图片描述
现在我们让它爬取两个类别,看看设定定时任务后能否自动爬取,然后存入数据库,自行展示
在这里插入图片描述
为了方便演示我这里设定了每分钟爬一次,’/’就是每的意思

*/1 * * * *

在这里插入图片描述

然后我们等一分钟,在我们没有做任何操作的情况下数据发生了改变,之前的数据被替换了,这就起到了定时爬取页面展示的效果

在这里插入图片描述
也可以手动运行代码
在这里插入图片描述

本人博客:https://blog.csdn.net/weixin_46654114
本人b站求关注:https://space.bilibili.com/391105864
转载说明:跟我说明,务必注明来源,附带本人博客连接。

请给我点个赞鼓励我吧
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/144967.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月18日 上午11:00
下一篇 2022年5月18日 上午11:20


相关推荐

  • 几种字符乱码

    几种字符乱码其他编码转成iso8859-1出现乱码?(问号):   原因:是因为iso8859-*的处理逻辑,对不存在的的码值直接解析为?号(0x3F)  演示://控制台设置为iso8859-1,输出一个左手图标”☜”,控制台显示乱码System.out.println(‘\u261c’);   解决:   处理好不同编码,iso是西欧用的比较多的编码,如果

    2022年6月7日
    37
  • java基本输入语句_java键盘输入语句

    java基本输入语句_java键盘输入语句在Java中进行输入时,最常用的两种输入方式为:1.使用ScannerScanner使用步骤:导入包importjava.util.Scanner;//导包的动作必须出现在类定义的上方创建对象//newScanner(System.in)为固定格式,不可以改变Scannersc=newScanner(System.in); 接收数据inti=sc.nextInt(); //这里使用的为int型,如果改变,则需要改变sc.nextInt();

    2025年11月25日
    5
  • SD卡、TF卡、MMC卡、emmc、sdio扫盲

    SD卡、TF卡、MMC卡、emmc、sdio扫盲一、sd卡、tf卡,mmc卡的区别:共同点:SDTFMMC都是在MMC基础上演化发展不同的规范,比如物理尺寸,封装,电压,管脚,位宽,时钟信号等不同,但都使用相同的总线规范。MMC(multiMediacard)是一种通信协议,支持两种模式SPI和MMC,定义了诸如卡的形态、尺寸、容量、电气信号、和主机之间的通信协议等。SD卡是SecureDigitalCard的英文缩写,直译就是“安全数字卡”。SD卡是(securedigitalmemorycar…

    2022年5月12日
    117
  • HttpServlet 类

    HttpServlet 类HttpServlet1 HttpServlet 概述 HttpServlet 类是 GenericServl 的子类 它提供了对 HTTP 请求的特殊支持 所以通常我们都会通过继承 HttpServlet 来完成自定义的 Servlet 2 HttpServlet 覆盖了 service 方法 HttpServlet 类中提供了 service HttpServle

    2026年3月18日
    2
  • 电容类别及封装形式_电容的种类和应用范围

    电容类别及封装形式_电容的种类和应用范围按介质分为:陶瓷、云母、纸质、薄膜、电解电容电解电容一般铝电解电容和钽电容,单片机晶振旁边的是独石电容1法拉=103毫法=106微法=109纳法=1012皮法;1pf=10-3nf=10-6uf=10-9mf钽电容封装:电解电容插件封装…

    2022年8月22日
    8
  • 免费pac代理地址_pac网址怎么设置

    免费pac代理地址_pac网址怎么设置问题起因:最近上http://nipponcolors.com/没上去,什么DNS污染啥的都试过了,最后是改本地PAC才好使得,大家可以用全局先看一下解决办法:添加如下连两行代码即可…

    2022年10月9日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号