Python爬虫_宅男福利?妹纸勿点__一蓑烟雨任平生「建议收藏」

全栈程序员-站长 • 2025年11月13日下午7:01 • 未分类 • 阅读 4

Python爬虫_宅男福利?妹纸勿点__一蓑烟雨任平生「建议收藏」咳咳直接上代码#!/usr/bin/envpython#-*-coding:utf-8-*-#@Time:2020/12/1519:10#@Author:huni#@File:图库大全1000.py#@Software:PyCharmimportrequestsfromlxmlimportetreeimportosif__name__==’__main__’:headers={‘User-A

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元售后保障童叟无欺

咳咳直接上代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2021/01/04 18:10
# @Author : 志伟
# @File : 图库大全1000.py
# @Software: PyCharm
import requests
from lxml import etree
import os

if __name__ == '__main__':
    headers = { 
   
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36'
    }
    m_path = './1000图库'
    if not os.path.exists(m_path):
        os.mkdir(m_path)
    for i in range(1, 2):
        url = f'https://www.1000tuku.com/guoneimeinv/list_5_{i}.html'
        resp = requests.get(url=url, headers=headers).text
        tree = etree.HTML(resp)
        href_list = tree.xpath('/html/body/div[4]/ul//@href')
        for href in href_list:
            resp1 = requests.get(url=href, headers=headers)
            # 处理中文乱码问题
            resp1_text = resp1.text.encode('ISO-8859-1').decode('GB18030')
            tree1 = etree.HTML(resp1_text)
            page_num = int(tree1.xpath('//*[@id="content"]/div[1]/div[2]/ul/li[1]/a/text()')[0][1:3])
            title = tree1.xpath('/html/head/title/text()')[0]
            title_path = m_path + f'/{title}'
            if not os.path.exists(title_path):
                os.mkdir(title_path)
            for j in range(1, page_num + 1):
                if j == 1:
                    every_herf = href
                else:
                    every_herf = href.replace('.html', f'_{j}.html')
                resp2 = requests.get(url=every_herf, headers=headers).text
                tree2 = etree.HTML(resp2)
                src_list = tree2.xpath('//*[@id="content"]/div[1]/div[1]//@src')
                for src in src_list:
                    jpg_data = requests.get(url=src, headers=headers).content
                    jpg_name = src.split('/')[-1]
                    jpg_path = title_path + f'/{jpg_name}'
                    with open(jpg_path, 'wb') as fp:
                        fp.write(jpg_data)
                        print(jpg_name, '下载完成')

咳咳,看看效果

在这里插入图片描述

放学啦,回家吃饭去吧

在这里插入图片描述

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/194038.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

如何设置Potplayer-x64

上一篇 2025年11月13日下午6:43

python win32gui打开软件_python win32gui 操作窗口

下一篇 2025年11月13日下午7:15

Linux文件锁

Linux文件锁翻阅参考资料，你会发现文件锁可以进行很多的分类，最常见的主要有读锁与写锁，前者也叫共享锁，后者也叫排斥锁，值得注意的是，多个读锁之间是不会相互干扰的，多个进程可以在同一时刻对同一个文件加读锁；但是，如果已经有一个进程对该文件加了写锁，那么其他进程则不能对该文件加读锁或者写锁，直到这个进程将写锁释放，因此可以总结为：对于同一个文件而言，它可以同时拥有多个读者，但是在某一时刻，他只能拥有一个写者。

全栈程序员-站长
2022年6月28日
45
STM32F103驱动GT911

STM32F103驱动GT9110x00引脚连接：//SCL——-PB10//SDA——-PB11//INT——–PB1//RST——–PB2IIC的SCL与SDA需要接上拉电阻！0x01模拟IIC：在模拟IIC的头文件中：定义所需的IO操作宏：//IO操作函数#defineIIC_SCLPBout(10)//…

全栈程序员-站长
2022年6月30日
34
pyCharm常用快捷键及常用设置（自动保存，字体大小、样式，主题）

pyCharm常用快捷键及常用设置（自动保存，字体大小、样式，主题）pyCharm 常用快捷键及常用设置自动保存字体大小样式主题

全栈程序员-站长
2026年3月27日
1
数组截取方法-Arrays.copyOfRange()详解[通俗易懂]

数组截取方法-Arrays.copyOfRange()详解[通俗易懂]Arrays.copyOfRange();publicstatic<T>T[]copyOfRange(T[]original,intfrom,intto){returncopyOfRange(original,from,to,(Class<?extendsT[]>)original.getClass());}入参：数组，开始下标，结束下标反参：数组功能描述：将一个原始的数组original，从下标from开始复制，复制到

全栈程序员-站长
2022年5月20日
42
NTP协议详解_ntp是安全协议吗

NTP协议详解_ntp是安全协议吗前言NTP(NetworkTimeProtocol）网络时间协议基于UDP，用于网络时间同步的协议，使网络中的计算机时钟同步到UTC，再配合各个时区的偏移调整就能实现精准同步对时功能。提供NTP对时的服务器有很多，比如微软的NTP对时服务器，利用NTP服务器提供的对时功能，可以使我们的设备时钟系统能够正确运行。NTP报文格式NTP报文格式如上图所示，它的字段含义参考如下：L…

全栈程序员-站长
2022年10月12日
4
字符串匹配算法详解视频_字符串匹配时间复杂度

字符串匹配算法详解视频_字符串匹配时间复杂度希望看到文章的你们，能够在今年的研究生考试中超常发挥。愿你们都能考上自己心仪的学校，为你们的备考生涯划上一个完美的句号。做为你们的师兄有几句话想对你们说，希望这些话能对你们有一些帮助。马…

全栈程序员-站长
2022年8月21日
6

发表回复

关注全栈程序员社区公众号