爬取7160美女图片

爬取7160美女图片#coding=utf-8importurllib.requestfrombs4importBeautifulSoupfromurllibimporterrorimportrels=[‘zhenrenxiu’,’meinv’,"lianglichemo",’rentiyishu’,’xiaohua’]defvalidateTitle(title):rstr=r"…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

#coding=utf-8

import urllib.request
from bs4 import BeautifulSoup
from urllib import error
import re
ls = ['zhenrenxiu','meinv',"lianglichemo",'rentiyishu','xiaohua']
def validateTitle(title):
rstr = r"[\/\\\:\*\?\"\<\>\|]" # '/ \ : * ? " < > |'
new_title = re.sub(rstr, "_", title) # 替换为下划线
return new_title

for j in range(1,60000):
url_origin = "http://www.7160.com/xiaohua/"+str(j)
try:
page_obj = urllib.request.urlopen(url_origin)
page_soup = BeautifulSoup(page_obj,'lxml')
total_page_obj = page_soup.find(text=re.compile('共')).string
pattern = re.compile(r'\d+')
match = pattern.search(total_page_obj)

if match == None:
total_page = 0;
else:
total_page = match.group();

for i in range(1,int(total_page)):
if i == 1 :
url = url_origin+"/index.html"
else:
url = url_origin+"/index_"+str(i)+".html"
request = urllib.request.Request(url)
try:
res = urllib.request.urlopen(request)

soup = BeautifulSoup(res,'lxml')
title_obj = soup.find(attrs={"class":"picmainer"})

if title_obj is not None:
print(url)
title = title_obj.h1.string
content = soup.find('img')
src = content.get("src")

file_name = validateTitle(title)+".jpg"
urllib.request.urlretrieve(src, "D://img2/"+file_name)
print(file_name+"保存成功")
except Exception as e:
print("异常"+str(j))
except Exception as e:
print("异常"+str(j))

Jetbrains全家桶1年46,售后保障稳定

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/207160.html原文链接:https://javaforall.net

(0)
上一篇 2025年8月2日 上午7:01
下一篇 2025年8月2日 上午7:43


相关推荐

  • 常见的js算法_javascript数据结构与算法

    常见的js算法_javascript数据结构与算法常见的几种js算法(一)快速排序算法1.1:先从数列中取出一个数作为“基准”。1.2:分区过程:将比这个“基准”大的数全放到“基准”的右边,小于或等于“基准”的数全放到“基准”的左边。1.3:再对左右区间重复第二步,直到各区间只有一个数。代码实现:varquickSort=function(arr){if(arr.length<=1){retur…

    2022年10月4日
    6
  • Activiti工作流的详细介绍[通俗易懂]

    Activiti工作流的详细介绍[通俗易懂]一、了解工作流1、工作流(Workflow),就是“业务过程的部分或整体在计算机应用环境下的自动化”,它主要解决的是“使在多个参与者之间按照某种预定义的规则传递文档、信息或任务的过程自动进行,从而实现某个预期的业务目标,或者促使此目标的实现。2、工作流管理系统(WorkflowManagementSystem,WfMS)是一个软件系统,它完成工作量的定义和管理,并按照在系统中预先定义好的工作流逻辑进行工作流实例的执行。工作流管理系统不是企业的业务系统,而是为企业的业务系统的运行提供了一个软件的

    2022年10月6日
    4
  • gradle和maven区别

    gradle和maven区别Gradle 和 Maven 都是项目自动构建工具 编译源代码只是整个过程的一个方面 更重要的是 你要把你的软件发布到生产环境中来产生商业价值 所以 你要运行测试 构建分布 分析代码质量 甚至为不同目标环境提供不同版本 然后部署 整个过程进行自动化操作是很有必要的 整个过程可以分成以下几个步骤 编译源代码运行单元测试和集成测试执行静态代码分析 生成分析报告创建发布版本部署到目标环境部署传递过

    2026年3月20日
    2
  • 什么工厂前景好_干什么行业最赚钱

    什么工厂前景好_干什么行业最赚钱农村创业不少人近期开始关注一些加工厂项目,尤其是小型加工厂这几年在乡镇地区超级火的,这些项目成本低利润高,而且招人也容易。那么,在农村做什么小加工厂赚钱呢?下面一起来探讨下最有前景的小型工厂项目,都是一些适合在乡镇开的加工厂年赚百万不是问题,赶紧来了解下吧。最有前景的小型工厂做什么赚钱1、木炭加工木炭是生活最常用的燃料,木炭的用途非常广,可用于冶金行业、建筑行业、干燥行业、医用行业等。一般常见的木炭有果木炭,即用原木砍伐后经过燃烧与蒸馏等加工工序而成的燃料,它可用于家庭燃料,也可用于野外烧烤,是一

    2025年11月1日
    5
  • 计划任务配置(任务计划程序)

    计划任务配置(任务计划程序)打开 任务计划程序 点击 任务计划程序库 在右则会看到操作项里有 创建基本任务 和 创建任务 如图所示 点击 创建任务 后如图所示 填写好相应的名称和勾选好必要的条件选择 触发器 选项 点击 新建 创建任务执行时间 重复任务间隔 这个选择后 后面有时间选择 是每小时 还是每分 可自己选择后再修改时间 再确定 再来配置需要执行的 操作 就是选择所写的程序或是 BAT 文件

    2026年3月18日
    1
  • OpenClaw 部署文档

    OpenClaw 部署文档

    2026年3月13日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号