Python爬虫（三）—— 爬取网站图片

全栈程序员-站长 • 2026年3月18日下午3:42 • 未分类 • 阅读 2

Python爬虫（三）—— 爬取网站图片Python 爬虫三爬取网站图片

Python爬虫 —— requests

Python爬虫（三）—— 爬取网站图片

Python爬虫（三）—— 爬取网站图片

大家可以关注知乎或微信公众号的share16，我们也会同步更新此文章。

一、思路

二、源代码分析

免费听了一节公开课后，我学到一些知识，现在分享给大家：

网站输入要搜索的关键字，右击选择‘显示页面源文件’，如下操作；
爬取网站数据时，我们要用 r.text 还是 r.json() ？
我们需查看要爬取网站的源代码，若开头是‘DOCTYPE html’，用 r.text ；若开头是{key1:value1,···}，用 r.json() ；根据实际情况，我们此时要用到的是r.json()。
r.json()：返回的是字典类型，可以通过键值获取相应的值；
r.text：返回的类型为字符串，无法通过键值获取相应的值；
图片数据储存在 data键对应的值中，以列表形式显示，且列表中每个元素(储存着图片信息)都是一个字典；
每张图片的链接储存在 thumbURL键对应的值内；名称储存在 fromPageTitleEnc键对应的值内；
下载图片

# 图片以二进制格式储存 with open('文件名', 'wb') as f: r.write('要插入的文件名')

三、代码

源代码：点此下载

要注意的地方：

getImage函数中，要根据实际情况修改file_addr；
main函数中，kv中开始只定义了User-Agent，提示：forbid spider access；后续，增加了Accept和Accept-Language；

四、运行结果

在这里插入图片描述

谢谢大家?

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/214677.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

LINUX操作系统练习题

上一篇 2026年3月18日下午3:42

文本聚类！

下一篇 2026年3月18日下午3:42

AEJoy —— 介绍神奇的 10 个 AE 表达式附带 2 种简单的调试方法

对于那些不熟悉AE的人来讲很快那么AE表达式是什么呢?AE表达式是一个基于Javascript编程语言的代码，您可以通过按Alt+左键点击小码表来插入到AE中。如图所示AE表达式非常强大，可以非常方便地制作酷炫的运动图形特效。它令人惊奇的地方是，仅仅需要少许的编程代码，它可以就可以帮助您的动画生动地运动起来。AE表达式可以显著改善您的工作流程，当您创建一个拥有复杂代码的动画时，甚至可以真切地实现惊人的动态图形特效。弹性表达式弹性表达式…

全栈程序员-站长
2022年4月6日
36
java.exe 0xc000012d_应用程序无法正常启动0xc000012d，此情况要怎么解决，望大神交一交…

java.exe 0xc000012d_应用程序无法正常启动0xc000012d，此情况要怎么解决，望大神交一交…应用程序无法正常启动0xc0000142解决方法：1、打开“运行”输入→cmd→回车2、然后把下面这行字符复制到黑色cmd框里面去回车等待dll文件全部注册完成就关闭可以了,为防止输入错误可以复制这条…电脑上出现应用程序正常2113初始化(0xc000142)失败，5261这是由于计算机中的系统进程出错4102导1653致的，具体的修复方法如下：1、首先，在电脑上打开设备管理器：2、然…

全栈程序员-站长
2026年4月14日
3
git把某个文件去除版本控制

git把某个文件去除版本控制

全栈程序员-站长
2021年10月20日
87
再见VS Code，我用Fleet！

再见VS Code，我用Fleet！大家好，我是辰哥~点击下方名片关注和星标『Python研究者』！????点击关注｜设为星标｜干货速递????来源Fleet官网：https://www.jetbrains.com/zh-cn/flee…

全栈程序员-站长
2022年5月4日
209
lcd像素点密度_常见液晶显示分辨率对应像素密度[通俗易懂]

lcd像素点密度_常见液晶显示分辨率对应像素密度[通俗易懂]液晶屏尺寸主流屏幕分辨率屏幕像素密度(PPI)产品类型800×4803英寸:3113.5英寸:2664英寸:233960×6403.5英寸:3294英寸:2884.3英寸:2681280×7204.3英寸:3414.7英寸:3125英寸:2931920×10805英寸:4407英寸:3142048x1080_2K6英寸:3857英寸:3301280×8007英寸:2158英寸…

全栈程序员-站长
2022年6月12日
128
豆包

“存在未申报的亲密关系”，字节跳动“大瓜”落地：前豆包大模型负责人及其关联HRBP被辞退、全额扣发年终奖

“存在未申报的亲密关系”，字节跳动“大瓜”落地：前豆包大模型负责人及其关联HRBP被辞退、全额扣发年终奖

Ai探索者
2026年3月12日
2

发表回复

关注全栈程序员社区公众号