python读取图片文件名_python 获取图片并自动命名保存

python读取图片文件名_python 获取图片并自动命名保存#-*-coding:UTF-8-*-#导入第三方库importurllibfrombs4importBeautifulSoupimportrequestsimportosimporttimeimportrandom#获取文件夹,如果文件夹不存在则创建新文件夹ifos.path.isdir(‘E://biaoqing//’):passelse:os.mkdir(‘E…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

# -* – coding: UTF-8 -* –

#导入第三方库

import urllib

from bs4 import BeautifulSoup

import requests

import os

import time

import random

# 获取文件夹,如果文件夹不存在则创建新文件夹

if os.path.isdir(‘E://biaoqing//’):

pass

else:

os.mkdir(‘E://biaoqing//’)

get_url=’http://qq.yh31.com’

i=58

while i>0:

print(‘第%s页:’%str(59 – int(i)))

local = “E:\\biaoqing\\” # 保存图片的文件夹

url = ‘http://qq.yh31.com/ka/qw/List_%s.html’% i

Agent = [

‘Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0’,

‘Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10’,

‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36’,

‘Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11’,

‘Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)’,

‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36’

]

User_Agent = random.choice(Agent)

headers = {‘User-Agent’: User_Agent}

html_ = requests.get(url, headers=headers)

html_.encoding = ‘utf-8’

html_doc=html_.text

soup = BeautifulSoup(html_doc, ‘lxml’) # 解析 html_doc

# 获取所有img标签里面 属性border值为0的img标签

pss = soup.find_all(‘img’,attrs={‘border’:0})

for ims in pss:

img_url = get_url + ims[‘src’] # 图片的路径

print(img_url)

mingcheng = ‘%s’ % ims[‘alt’] # 图片命名所用,alt内容为图片名称

s = ‘%s’ % ims[‘src’] # 获取字符 截取相应的名称及格式

geshi = s.split(‘.’)[-1] # 图片命名所用,获取图片的格式

ming=mingcheng+’.’+geshi

urllib.request.urlretrieve(img_url, local + ‘%s’%ming)

time.sleep(0.5)

print(‘=====================================================’)

i=i-1

time.sleep(2) # 设置休眠时间,访问频繁容易被封

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/197377.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • mycat如何实现读写分离_数据库读写分离中间件

    mycat如何实现读写分离_数据库读写分离中间件前言众所周知,随着用户量的增多,数据库操作往往会成为一个系统的瓶颈所在,而且一般的系统“读”的压力远远大于“写”,因此我们可以通过实现数据库的读写分离来提高系统的性能。基础知识要实现读写分离,就要解决主从数据库数据同步的问题,在主数据库写入数据后要保证从数据库的数据也要更新。实现思路一个主数据库用来写数据,一个或多个从数据库用来读数据,将主数据库的数据同步到从数据库中。一,主从同步的原理主服务器master记录数据库操作日志到Binarylog,从服务器开启i/o线程将二进制日志记录的

    2022年10月13日
    4
  • PHP获取客户端IP地址方式[通俗易懂]

    PHP获取客户端IP地址方式[通俗易懂]一、如果没有使用代理服务器REMOTE_ADDR=客户端IPHTTP_X_FORWARDED_FOR=没数值或不显示$ip=$_SERVER[‘REMOTE_ADDR’];二、使用透明代理REMOTE_ADDR=最后一个代理服务器IPHTTP_X_FORWARDED_FOR=客户端真实IP(经过多个代理服务器时,这个值类似:221.5.252….

    2025年7月21日
    6
  • 虚拟存储技术的概念及特点[通俗易懂]

    虚拟存储技术的概念及特点[通俗易懂]一、虚拟存储的概念    所谓虚拟存储,就是把多个存储介质模块(如硬盘、RAID)通过一定的手段集中管理起来,所有的存储模块在一个存储池(Storage Pool)中得到统一管理,从主机和工作站的角度,看到就不是多个硬盘,而是一个分区或者卷,就好象是一个超大容量(如1T以上)的硬盘。这种可以将多种、多个存储设备统一管理起来,为使用者提供大容量、高数据传输性能的存储系统,就称之为虚拟存储。

    2022年9月26日
    3
  • Python换行符问题:\r\n还是\n?[通俗易懂]

    这是一个很经典的问题。因为不同系统下默认的换行符不同。字符处理时候,这样的“不同”会带来很大的问题,例如line[-2]和line.strip()会因为平台不同返回不同的值。解决方法:Python2(PEP278–UniversalNewlineSupport,感谢毕勤的补充):1)如果不是txt文件,建议用wb和rb来读写。通过二进制读写,不会有换行问题。2)如果需要明文内容,请用…

    2022年4月5日
    429
  • Opencv cvCircle()函数[通俗易懂]

    Opencv cvCircle()函数[通俗易懂]Circle,即圆形。cvCircle是指绘制圆形的一个程序函数。

    2022年7月24日
    14
  • 卸载jdk1.7

    卸载jdk1.7卸载jdk1.7:1、开始->程序->控制面板->卸载程序->程序和功能2、找到jdk的两个程序:java7update45和java(TM)SEDevelopmentKit73、右键->卸载转载于:https://www.cnblogs.com/Noul/p/10406623.html…

    2022年6月25日
    55

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号