python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

突然在网上看见自己喜欢的图片,想下载,只能一张图片一张图片的点击,想一想,你要下载的图片有10000张,那会是一个怎么样的画面,答案很简单,你会哭的,假如一张图片从搜索出来,到点击放大,再到下载,假如以最快速度,中间不间断,那我们来算一下时间,

搜索->点击图片->保存最大的图片->点击下载->点击保存。

简单的一套下来,除去搜索,最简单的步骤是4步,每一步算1秒钟,4秒,那就是40000秒,也就是11.1个小时,等下完这些图片,估计已经吐血了,那好,我们在来增加步骤,加上搜索,加上修改名称,网络问题不考虑,那就是6步,6万秒,只是多了两步,却是多了5个多小时,想想那是多痛苦的事。

下面,是传受你武功秘籍的时候了,只要掌握五个步骤,下载分分钟钟的事,还等什么,直接上代码:

import requests#导入两个模块

import re



url=requests.get("http://www.kuman.com/")#请求url

url.encoding="utf-8"#编码格式,根据情况指定

url_text=url.text#获取到网页内容

extract=r'<a href="(.*?)" title=".*?">'#正则表达式

img_url=re.findall(extract,url_text)#根据正则表达式提取url

print(img_url)#这里可以打印看一下。

 

然后一个爬虫就完成了,至于后面的操作都是根据这个重复操作得到的,就不一 一叙述。

 

关注公众号,后台输入:“爬虫教程”  获取整套的爬虫视频链接。

python爬虫-爬取网站图片。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111425.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 创建和使用逐帧动画

    创建和使用逐帧动画

    2022年1月1日
    40
  • 1024程序员节由来(1024程序员节宣言)

    曾经,在许多人的心中,程序员应该是这样的:画像格子衬衫不善言辞无女友电脑包常年加班但是呢,他们还有哪些不为人知的一面:1代码的好基友bug的大克星程序员的日常活动是什么呢?他们在食堂敲代码;他们在书店敲代码;他们在咖啡厅敲代码;他们甚至在斑马线上敲代码……他们的喜怒哀乐也很简单:一大串SQL语句,居然一下就成功时:(不敢相信)当代码没有正常执行,却不知道原因时…

    2022年4月16日
    45
  • linux的rwx权限解读

    linux的rwx权限解读linux的rwx权限解读:我们输入指令:ls-l会看到类似我这样的语句drwx-xr-x-我们可以这样解读:首字母:文件类型d:d开头的是文件夹-:文件l:连接(快捷方式)c:硬件设备然后是三组rwx:第一组rwx:创建着权限。第二组rwx:创建者所属组权限。第三组rwx:访客权限。r:可读(4)w:可写(2)x:可执…

    2022年6月9日
    48
  • 存储过程基础语法

    存储过程基础语法存储过程1CREATE OR REPLACE PROCEDURE 存储过程名2IS3BEGIN4NULL;5END;行1:CREATE&

    2022年7月1日
    19
  • PostgreSQL 10.1 手册_部分 III. 服务器管理_第 20 章 客户端认证

    PostgreSQL 10.1 手册_部分 III. 服务器管理_第 20 章 客户端认证

    2021年6月14日
    84
  • 网络号和主机号的计算

    网络号和主机号的计算网络号和主机号的计算当前使用的IP地址有4个字节(32)组成,即IPV4编码方式。每个IP地址包换两部分:网络号和主机号。当分配给主机号的二进制位越多,则能标识的主机数就越多,相应地能标识的网络数就越少,反之亦然。IP地址分为五类,A类保留给政府机构,B类分配给中等规模的公司,C类分配给任何需要的人,D类用于组播,E类用于实验,各类可容纳的地址数目不同。A、B、C三类IP地址的特征:当将IP…

    2022年6月24日
    34

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号