python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

突然在网上看见自己喜欢的图片,想下载,只能一张图片一张图片的点击,想一想,你要下载的图片有10000张,那会是一个怎么样的画面,答案很简单,你会哭的,假如一张图片从搜索出来,到点击放大,再到下载,假如以最快速度,中间不间断,那我们来算一下时间,

搜索->点击图片->保存最大的图片->点击下载->点击保存。

简单的一套下来,除去搜索,最简单的步骤是4步,每一步算1秒钟,4秒,那就是40000秒,也就是11.1个小时,等下完这些图片,估计已经吐血了,那好,我们在来增加步骤,加上搜索,加上修改名称,网络问题不考虑,那就是6步,6万秒,只是多了两步,却是多了5个多小时,想想那是多痛苦的事。

下面,是传受你武功秘籍的时候了,只要掌握五个步骤,下载分分钟钟的事,还等什么,直接上代码:

import requests#导入两个模块

import re



url=requests.get("http://www.kuman.com/")#请求url

url.encoding="utf-8"#编码格式,根据情况指定

url_text=url.text#获取到网页内容

extract=r'<a href="(.*?)" title=".*?">'#正则表达式

img_url=re.findall(extract,url_text)#根据正则表达式提取url

print(img_url)#这里可以打印看一下。

 

然后一个爬虫就完成了,至于后面的操作都是根据这个重复操作得到的,就不一 一叙述。

 

关注公众号,后台输入:“爬虫教程”  获取整套的爬虫视频链接。

python爬虫-爬取网站图片。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111425.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • intellij idea javaweb_数据库系统原理教程

    intellij idea javaweb_数据库系统原理教程一,简介Eclipse/MyEclipse确实用起来诸多不爽,准备切换IntelliJIDEA,本篇介绍如何配置IDEA并使用IDEA开发一个Web应用。二,软件下载与安装1,首先下载安装JDK并配置环境变量。JDK安装目录D:\Java\jdk1.7.0_79新建环境变量JAVA_HOME,其值为D:\Java\jdk1.7.0_79环境变量PATH中添加%JAVA_HOME%\bin

    2025年5月24日
    1
  • AWStats日志分析

    AWStats日志分析AWStats日志分析系统介绍1.AWStats日志分析系统(1)Peri语言开发的一款开源日志分析系统(2)可用来分析Apache、Samba、Vsftpd、IIS等服务器的访问日志(3)信息结合crond等计划任务服务,可对日志内容定期进行分析部署AWStats日志分析系统1.安装AWStats软件包2.为要统计的站点建立配置文件3.修改站点统计配置文件…

    2022年7月16日
    20
  • navicate premium15 激活码(注册激活)[通俗易懂]

    (navicate premium15 激活码)这是一篇idea技术相关文章,由全栈君为大家提供,主要知识点是关于2021JetBrains全家桶永久激活码的内容IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.htmlS32PGH0SQB-eyJsaWN…

    2022年3月26日
    461
  • 图片切割工具—产生多个div切割图片 采用for和一的二维阵列设置背景位置

    图片切割工具—产生多个div切割图片 采用for和一的二维阵列设置背景位置

    2022年1月12日
    39
  • Linux文件锁

    Linux文件锁翻阅参考资料,你会发现文件锁可以进行很多的分类,最常见的主要有读锁与写锁,前者也叫共享锁,后者也叫排斥锁,值得注意的是,多个读锁之间是不会相互干扰的,多个进程可以在同一时刻对同一个文件加读锁;但是,如果已经有一个进程对该文件加了写锁,那么其他进程则不能对该文件加读锁或者写锁,直到这个进程将写锁释放,因此可以总结为:对于同一个文件而言,它可以同时拥有多个读者,但是在某一时刻,他只能拥有一个写者。

    2022年6月28日
    42
  • python输出语句print用法_python print输出

    python输出语句print用法_python print输出【时间】2018.10.12【题目】python中的print输出函数用法总结 一、直接输出无论什么类型,数值,布尔,列表,字典…都可以直接输出,或者先赋值给变量,再输出。  二、格式化输出下面是《Python基础编程》中对格式化输出的总结:(1).%字符:标记转换说明符的开始(2).转换标志:-表示左对齐;+表示在转换值之前要加上正负号;“”(…

    2025年7月10日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号