python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

突然在网上看见自己喜欢的图片,想下载,只能一张图片一张图片的点击,想一想,你要下载的图片有10000张,那会是一个怎么样的画面,答案很简单,你会哭的,假如一张图片从搜索出来,到点击放大,再到下载,假如以最快速度,中间不间断,那我们来算一下时间,

搜索->点击图片->保存最大的图片->点击下载->点击保存。

简单的一套下来,除去搜索,最简单的步骤是4步,每一步算1秒钟,4秒,那就是40000秒,也就是11.1个小时,等下完这些图片,估计已经吐血了,那好,我们在来增加步骤,加上搜索,加上修改名称,网络问题不考虑,那就是6步,6万秒,只是多了两步,却是多了5个多小时,想想那是多痛苦的事。

下面,是传受你武功秘籍的时候了,只要掌握五个步骤,下载分分钟钟的事,还等什么,直接上代码:

import requests#导入两个模块

import re



url=requests.get("http://www.kuman.com/")#请求url

url.encoding="utf-8"#编码格式,根据情况指定

url_text=url.text#获取到网页内容

extract=r'<a href="(.*?)" title=".*?">'#正则表达式

img_url=re.findall(extract,url_text)#根据正则表达式提取url

print(img_url)#这里可以打印看一下。

 

然后一个爬虫就完成了,至于后面的操作都是根据这个重复操作得到的,就不一 一叙述。

 

关注公众号,后台输入:“爬虫教程”  获取整套的爬虫视频链接。

python爬虫-爬取网站图片。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111425.html原文链接:https://javaforall.net

(0)
上一篇 2021年9月17日 下午6:00
下一篇 2021年9月17日 下午7:00


相关推荐

  • pytest报错_pytest失败重跑

    pytest报错_pytest失败重跑前言我们每天写完自动化用例后都会提交到git仓库,随着用例的增多,为了保证仓库代码的干净,当有用例新增的时候,我们希望只运行新增的未提交git仓库的用例。pytest-picked插件可以

    2022年7月29日
    9
  • ewebeditor php漏洞,ewebeditor for php任意文件上传漏洞「建议收藏」

    ewebeditor php漏洞,ewebeditor for php任意文件上传漏洞「建议收藏」此漏洞仅测试了最新版v3.8,不知道低版本是否存在此漏洞。PHP版本的ewebeditor并没有使用数据库来保存配置信息,所有信息位于php/config.php中,代码如下:$sUsername=”admin”;$sPassword=”admin”;[separator]$aStyle[1]=”gray|||gray|||office|||../uploadfile/|||550||…

    2022年7月14日
    15
  • 一致性hash算法 java实现_一致性hash算法实现

    一致性hash算法 java实现_一致性hash算法实现一致性hash算法是分布式中一个常用且好用的分片算法、或者数据库分库分表算法。现在的互联网服务架构中,为避免单点故障、提升处理效率、横向扩展等原因,分布式系统已经成为了居家旅行必备的部署模式,所以也产出了几种数据分片的方法:1.取模,2.划段,3.一致性hash前两种有很大的一个问题就是需要固定的节点数,即节点数不能变,不能某一个节点挂了或者实时增加一个节点,变了分片规则就需要改变,需要迁…

    2026年4月17日
    4
  • 深入理解ConcurrentHashMap原理分析以及线程安全性问题

    深入理解ConcurrentHashMap原理分析以及线程安全性问题在之前的文章提到CurrentHashMap是一个线程安全的,那么我么看一下CurrentHashMap如何进行操作的。CurrentHashMap与HashTable区别?HashTableput()源代码从代码可以看出来在所有put的操作的时候都需要用synchronized关键字进行同步。并且key不能为空。这样相当于每次进行put的时候都会进行同

    2022年6月18日
    29
  • 混元2.0、DeepSeek V3.2,都在元宝了!

    混元2.0、DeepSeek V3.2,都在元宝了!

    2026年3月12日
    3
  • bindService流程详解

    bindService流程详解bindService的流程,入口同样在ContextImpl中。ContextImpl.javapublicbooleanbindService(Intentservice,ServiceConnectionconn,intflags){warnIfCallingFromSystemProcess();returnbindServiceCommon(service,conn,flags,mMainThread.getHandler(),Process.my

    2022年5月11日
    55

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号