打造自己的ip代理池

打造自己的ip代理池在爬虫时经常需要使用代理,于是我爬取了一个可以免费提供代理的网址,从中获取免费代理,从而打造属于一个自己的代理池。如图所示,这是网址的界面展示,我们需要做的就是需要其中的ip、port列中的数据,获取数据后需要我们拼接成一个完整的IP然后保存即可,代码如下:importrequestsfromlxmlimportetreeimportosurl=’https://www.kuaidaili.com/free/inha/3/’headers=…

大家好,又见面了,我是你们的朋友全栈君。

        在爬虫时经常需要使用代理,于是我爬取了一个可以免费提供代理的网址,从中获取免费代理,从而打造属于一个自己的代理池。

        如图所示,这是网址的界面展示,我们需要做的就是需要其中的ip、port列中的数据,获取数据后需要我们拼接成一个完整的IP然后保存即可,代码如下:

import requests
from lxml import etree
import os

url = 'https://www.kuaidaili.com/free/inha/3/'
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'
    }

content = requests.get(url,headers = headers).text
resonse = etree.HTML(content)
tr_list = resonse.xpath('//div[@id="list"]/table/tbody/tr')
#print(tr_list)
ip_list = []
for tr in tr_list:
    ip = tr.xpath('./td[1]/text()')
    port = tr.xpath('./td[2]/text()')
    proxy_ip = ip[0] +':' +  port[0]
    #print(proxy_ip)
    ip_list.append(proxy_ip)
print(ip_list)

        代码运行后获取到完整的ip数据,接下来我们就可以使用这些代理了,这里需要使用random来随机选择一个ip。

打造自己的ip代理池

 

proxy=random.choice(ip_list) #本地代理
proxies={
    'http':'http://'+proxy,
    'https':'https://'+proxy
}
try:
    response=requests.get('网址',proxies=proxies)
    print(response.text)
except requests.exceptions.ConnectionError as e:
    print('错误:',e.args)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/138540.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • fork join框架原理_jalor6框架教程

    fork join框架原理_jalor6框架教程声明:本篇博客是在阅读了引用博客的两篇文章后做了简短的概括与归纳,只作为自己笔记文章目录一、思想二、工作窃取算法三、demo用例四、关键组件ForkJoinPoolForkJoinTaskForkJoinWorkerThreadWorkQueue五、Fork/Join运行流程图任务提交创建线程signalWork方法任务执行六、引用博客一、思想Fork/Join是Java7提供的并行执行…

    2026年2月3日
    3
  • PyCharm汉化后无法打开Settings设置「建议收藏」

    PyCharm汉化后无法打开Settings设置「建议收藏」通常为了方便直观的了解软件的用途,我们习惯导入jar包汉化软件,但同时也存在一些隐藏问题,这里的设置选项无法打开就是一个例子点击后无法显示任何内容这里提供两个jar包只需把相应包放到PyCharm安装目录里的lib目录里面即可。同时删掉之前的汉化包1:https://pan.baidu.com/s/16bydeP5gRBCblh0BAoWUzQ提取码:21ro2:https://pan…

    2022年5月25日
    139
  • php(ThinkPHP)实现微信小程序的登录过程

    php(ThinkPHP)实现微信小程序的登录过程

    2021年10月13日
    75
  • 图像修复简介

    图像修复简介点击上方 小白学视觉 选择加 星标 或 置顶 重磅干货 第一时间送达推荐阅读 42 个 pycharm 使用技巧 瞬间从黑铁变王者 GoogleC 项目编程风格指南

    2025年11月11日
    3
  • 使用request对象进行数据传递「建议收藏」

    使用request对象进行数据传递「建议收藏」在进行请求转发时,需要把一些数据传递到转发后的页面进行处理,需要使用request对象的setAttribute方法将数据保存到request范围内的变量中使用:request对象可以视为一个域,可以应用setAttribute()方法向域范围内存放数据request对象的setAttribute()方法的格式:request.setAttribute(Stringname,Objectobject);参数说明name:变量名,为String类型,object:用于指定需要在request

    2022年5月23日
    31
  • systemproperties_安卓system下载

    systemproperties_安卓system下载该楼层疑似违规已被系统折叠隐藏此楼查看此楼android状态栏点击右上角锁屏教程1.反编辑systemUI.apk2.打开res\layout的status_bar.xml3.查找字符这段代码的上面一行加入以下代码android:layout_gravity=”right”androidrientation=”vertical”android:id=”@id/home”android:lay…

    2026年1月20日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号