IP代理池的使用

IP代理池的使用参考书籍:python3网络爬虫开发与实战作者个人博客:https://cuiqingcai.com/下载IP代理池的程序,其作者放在了GitHub:https://github.com/Python3WebSpider/ProxyPool需要的工具:pycharm、各种库、python37、redis安装、redis可视化工具(在参考书籍作者博客中都有安装方法)1、下载IP…

大家好,又见面了,我是你们的朋友全栈君。

参考书籍:python3网络爬虫开发与实战     作者个人博客https://cuiqingcai.com/

下载IP代理池的程序,其作者放在了GitHubhttps://github.com/Python3WebSpider/ProxyPool

需要的工具:pycharm、各种库、python37、redis安装、redis可视化工具(在参考书籍作者博客中都有安装方法)

1、下载IP代理池的安装包,压缩用pycharm打开点击File->Open->选择你刚下载的代理池的文件夹->New Window,等待片刻

IP代理池的使用IP代理池的使用

2、点击pycharm里的命令行(Terminal),输入python run.py,运行代码,可以看到正在爬取ip

IP代理池的使用

IP代理池的使用

3、打开redis数据库可视化工具,能看到爬取的ip存在数据库中,在浏览器中输入http://127.0.0.1:5555/random,可以打印出redis中的其中一个可用的IP

IP代理池的使用

IP代理池的使用IP代理池的使用

4、在pycharm中新创建一个.py文件,请求该http://127.0.0.1:5555/random,在下面图中可以看到能打印出IP地址

IP代理池的使用

5、现在我们用代理池的IP来请求我们需要的网址,运行过后可以看到IP地址是你数据库中的IP地址,说明代理成功

import requests

PROXY_POOL_URL = 'http://localhost:5555/random'

def get_proxy():
    try:
        response = requests.get(PROXY_POOL_URL)
        if response.status_code == 200:
            return response.text
    except ConnectionError:
        return None

def get():
    proxy = get_proxy()
    proxies = {
        'http': 'http://' + proxy,
        'https': 'https://' + proxy
    }

    try:
        response = requests.get('http://httpbin.org/get', proxies=proxies)
        print(response.text)
    except requests.exceptions.ConnectionError as e:
        print('Error', e.args)

if __name__ == '__main__':
    get()

IP代理池的使用

注意点:请求redis中的IP的时候,IP代理池不能关闭,如果关闭,则不会获取到redis中的IP

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142090.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月9日 下午11:40
下一篇 2022年5月9日 下午11:40


相关推荐

  • 如何在国内使用 GPT-4?升级 ChatGPT 4.0 的详细教程

    如何在国内使用 GPT-4?升级 ChatGPT 4.0 的详细教程

    2026年3月16日
    4
  • edgeR的使用

    edgeR的使用edgeR 包是进行 RNA seq 数据分析非常常用的一个 R 包 该包需要输入每个基因关于每个样本的 reads 数的数据 每行对应一个基因 每一列对应一个样本 建议使用 htseq count 进行统计 输出文件即可直接使用 如果需要算 RPKM 需要自己统计基因长度信息

    2026年3月20日
    2
  • java类加载器是什么_类加载器有几种

    java类加载器是什么_类加载器有几种类加载器是有了解吗?解析:底层原理的考察,其中涉及到类加载器的概念,功能以及一些底层的实现。答:顾名思义,类加载器(classloader)用来加载Java类到Java虚拟机中。一般来说,Java虚拟机使用Java类的方式如下:Java源程序(.java文件)在经过Java编译器编译之后就被转换成Java字节代码(.class文件)。类加载器负责读取Java…

    2022年8月11日
    8
  • Python初识模块之正则表达式

    Python初识模块之正则表达式什么是正则表达式  正则表达式是字符串匹配的一种规则,在线测试工具http://tool.chinaz.com/regex/[字符组]在同一个位置可能出现的各种字符组成了一个字符组,在正则表达式中用[]表示字符分为很多类,比如数字、字母、标点等等。假如你现在要求一个位置”只能出现一个数字”,那么这个位置上的字符只能是0、1、2…9这10个数之一。[0-9]、[a-z]、[A…

    2022年7月13日
    20
  • Activity 工作流框架学习总结「建议收藏」

    Activity 工作流框架学习总结「建议收藏」环境的搭建和数据表的了解1.什么是工作流?工作流(Workflow),就是“业务过程的部分或整体在计算机应用环境下的自动化”,它主要解决的是“使在多个参与者之间按照某种预定义的规则传递文档、信息或任务的过程自动进行,从而实现某个预期的业务目标,或者促使此目标的实现”。工作流管理系统(WorkflowManagementSystem,WfMS)是一个软件系统,它完成工作量的定义

    2022年5月7日
    99
  • JavaScript(1)高阶函数filter、map、reduce

    JavaScript(1)高阶函数filter、map、reduce前言需求:有这样一个数组[10,20,110,200,60,30,40]1.筛选出数组中小于100的元素2.将筛选出的每个元素的值x23.完成第2步之后,将数组中的所有元素加起来

    2022年7月31日
    10

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号