Python爬虫必备技能,使用 动态代理ip 爬取 Youtube游戏模块主页 示例,不翻墙无版权

Python爬虫必备技能,使用 动态代理ip 爬取 Youtube游戏模块主页 示例,不翻墙无版权动态ip相信大家肯定都听说过,或者已经使用过。使用动态ip有很多好处,比如保护你的网络免受外部攻击、屏蔽你的IP地址等。那本篇文章就来研究一下这个动态ip,对这方面不了解的小伙伴正好可以一起学习一下。

大家好,又见面了,我是你们的朋友全栈君。

在这里插入图片描述

请添加图片描述


引言

  • 动态代理ip 相信大家肯定都听说过,或者已经使用过。
  • 本篇文章就来介绍一下什么是动态代理ip,还有一个使用代理ip爬取Youtube游戏模块主页
  • 使用动态ip有很多好处,比如保护你的网络免受外部攻击、屏蔽你的IP地址等。
  • 那本篇文章就来研究一下这个动态ip,对这方面不了解的小伙伴正好可以一起学习一下。

一、动态代理ip

1.1 什么是动态代理ip

动态代理IP,字面意思来说这个IP会随时随机发生变化,不是固定的,就是动态代理IP。动态代理IP一般会有网络爬虫用户使用。

动态IP 分为 长效代理短效代理

  • 长效代理代理IP:支持采集数据或者游戏挂机等许多业务,由于网络爬虫采集的数据量比较大,很少会选择长效代理,长效代理IP就相当于本地IP一样,访问一个网站久了自然IP也会被限制,而且采集的量非常小。不利于爬虫使用。

  • 短效代理IP:支持数据抓取、seo优化、 APP刷量,问答推广等许多业务。一般是网络爬虫用户选择动态短效代理IP的比较多。爬虫的业务量大,使用动态短效代理IP去进行数据采集的话,能大大提高业务效率。

1.2 使用动态代理IP好处

在这里插入图片描述

  1. 提高网站访问速度:浏览某个网站后,浏览的网站上的信息会存储在代理服务器的硬盘上。如果你再次浏览网站,这些信息可以随时在代理服务器中获取,而无需重新连接远程服务器。因此,它可以节省带宽,加快网站的浏览速度。
  2. 作为防火墙:可以保证局域网的安全,作为防火墙的功能,对于使用代理服务器的局域网来说,从外部来看,只有代理服务器才能看到,而其他局域网的用户则不能看到。代理商还可以用来限制IP地址的封锁,禁止用户浏览某些页面。
  3. 降低IP成本:应用代理服务器可以节省对IP地址的需求,从而降低IP地址的成本。
  4. 便于管理网络资源:可以限制部分共享资源进入特殊区域用户,维护资源的区域性。
  5. 提高爬虫的速率:使用动态代理ip可以绕过目标网站限制,更好的抓取网络数据,可以自定义时间更换ip地址,提高爬虫效率。

1.3 动态代理IP类别

动态代理IP 还分为透明代理匿名代理高匿代理
以此可以看出代理IP的质量强度。对于网络爬虫来说可以根据自己的需求来购买定制需要动态IP。

高匿代理自然也是动态代理IP类型中质量最好的一种,不少的企业爬虫用户都会选择隧道转发的高匿爬虫代理IP来给业务提供需要,保证自己的业务效果和质量。

透明代理匿名代理虽然也是代理IP,但是大大降低的爬虫业务的进展和效率,所以网络爬虫选择隧道转发的爬虫代理才是正确选择。


二、怎样申请 动态ip代理

2.1 选择合适的代理IP 网站

简单介绍了一下动态代理IP的概念和好处,再来说说怎样申请这个 动态代理IP 。

目前有很多的代理IP网站,根据稳定性和安全性对比价格差异很大。

那我这里使用的是 IPIDEA 这个网站,现在新用户有500M流量白嫖,正好我们可以拿来做实验。

可以直接点击注册就行了:http://www.ipidea.net/?utm-source=csdn&utm-keyword=?xy

进入网站之后点击 获取代理 -> API获取
在这里插入图片描述

然后根据自己的喜好选择 数量地区,其他的使用默认选项即可,然后点击下面的 生成链接
在这里插入图片描述
如果没有实名认证的话会跳出这个界面,点击认证就好
在这里插入图片描述

然后复制我们生成的链接,这个链接要保存好,后面使用Python爬取的时候会用到。
在这里插入图片描述
把链接单独复制再打开就会看到刚才生成的IP,这部分可以用于我们自己的浏览器手动设置使用。
在这里插入图片描述


三、浏览器怎样使用 代理ip

上一步中我们获取到了一个 ip代理池,接下来拿QQ浏览器示例,简单看一下怎样使用这些代理ip。

在QQ浏览器菜单列表内 – 设置高级网络更改代理服务器设置

在这里插入图片描述

在弹出的Internet属性窗口,点击局域网设置

在这里插入图片描述

填写我们复制的 IP端口号,并点击 确定
在这里插入图片描述
打开百度/谷歌搜索引擎,搜索:IP,查看当前代理后的IP地址

在这里插入图片描述
到这里我们就是成功使用 代理ip 了,接下来使用 该代理ip 就可以干一些其他事情了~

但是这只是一个最简单的用法,更高级的应该是在使用爬虫的时候使用该动态IP代理池达到一个更好的效果。

下面就来简单写一个用代理ip来访问CSDN博客个人主页的实例。


四、使用 动态代理ip 摘取 Youtube游戏模块 示例

使用Python写一个简单的 ip代理 示例,后面使用Python爬一些其他数据的时候都可以参照。

直接使用 requests 模块来做,然后再加一个随机请求头模块 fake_useragentUserAgent

下面就以 Youtube游戏模块 做一个简单的示例,界面内容如下:
在这里插入图片描述

完整代码如下所示,注释很详细,就不多做说明了。

# 微信搜索:[呆呆敲代码的小Y],回复[白嫖]获取超多精品编程学习资料!!
# 爬虫使用代理IP
# 导入模块:requests、fake-useragent、UserAgent
import requests
from fake_useragent import UserAgent

# 要访问的url地址
url='https://www.youtube.com/gaming'

# 随机请求头
headers={ 
   'User-Agent':UserAgent().random}

# 代理ip 的API(IPIDEA网站获取的)
api_url='http://tiqu.ipidea.io:81/abroad?num=100&type=1&lb=1&sb=0&flow=1&regions=&port=1'

res = requests.post(api_url,headers=headers, verify=True)

# proxies = {'协议': '协议://IP:端口号'}
proxie = "https://%s"%(res.text)
proxies = { 
   'http': proxie}

# 打印所有的代理ip
print(proxies)

# 访问Youtube游戏模块测试并输出结果
html=requests.get(url=url,headers=headers,proxies=proxies).text
print(html)

# 微信搜索:[呆呆敲代码的小Y],回复[白嫖]获取超多精品编程学习资料!!

运行效果所示:
在这里插入图片描述

爬取Youtube游戏模块主页的完整信息如下:
在这里插入图片描述

这里只是演示了使用 代理ip 爬取了 Youtube游戏模块主页,利用好 动态代理ip 能用的事情可就更多了,大家自行体验吧!

只要能用爬虫的地方,我们可以自定义一个时间自动切换ip,这样在爬取大量数据的时候就会避免被限制访问,提高爬虫效率。


五、总结

  • 关于 动态代理ip 这一块能做的功能不止爬取数据
  • 还可以做更多好玩有趣的事,比如刷##,爬## 等等,具体用处大家自行摸索吧!
  • 正好我最近也在更新Python的一些学习内容,大家对Python感兴趣的也可以来我的专栏学习哦。
  • 博主对于Python这一块不是特别熟练,可以更好的从一个Python初学者的角度去和大家一起深入学习!
  • 借助这个 Python零基础到入门 专栏 来跟大家一起学习Python相关的内容,如果有什么问题也欢迎在评论区一起讨论呀~

?往期优质文章分享


? 优质专栏分享 ?
  • ?如果感觉文章看完了不过瘾,可以来我的其他 专栏 看一下哦~
  • ?比如以下几个专栏:Unity基础知识学习专栏Unity游戏制作专栏Unity实战类项目 算法学习专栏
  • ?可以学习更多的关于Unity引擎的相关内容哦!直接点击下面颜色字体就可以跳转啦!

资料白嫖,技术互助

学习路线指引(点击解锁) 知识定位 人群定位
? Unity系统学习专栏 ? 入门级 本专栏从Unity入门开始学习,快速达到Unity的入门水平
? Unity实战类项目 ? 进阶级 计划制作Unity的 100个实战案例!助你进入Unity世界,争取做最全的Unity原创博客大全。
❤️ 游戏制作专栏 ❤️ 难度偏高 分享学习一些Unity成品的游戏Demo和其他语言的小游戏!
? 游戏爱好者八万人社区? 互助/吹水 游戏爱好者社区,白嫖奖品
? Python零基础到入门 ? Python初学者 针对没有经过系统学习的小伙伴,核心目的就是让我们能够快速学习Python的知识以达到入门

【游戏开发爱好者社区】活动进行中,每周打卡送书籍等礼品,期待你的加入

? 社区活动,重磅来袭 ?

【游戏开发爱好者社区】在本周重磅新推出【每日打卡】活动

? 新玩法,奖励升级!游戏开发爱好者社区:https://bbs.csdn.net/forums/unitygame

社区中心思想今天你学到了什么?

在社区你可以做些什么: 每日强化知识点,白嫖书籍礼品!

一个人可以走的很快,一群人才能走的更远!?爆C站的游戏开发爱好者社区欢迎您的加入!

更多白嫖活动详情:https://bbs.csdn.net/forums/unitygame?typeId=19603


温馨提示: 点击下面卡片可以获取更多编程知识,包括各种语言学习资料,上千套PPT模板和各种游戏源码素材等等资料。更多内容可自行查看哦!
请添加图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/136443.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • serialVersionUID详解「建议收藏」

    serialVersionUID详解「建议收藏」本人学习笔记,仅供自己查阅

    2022年7月3日
    32
  • scsa笔记1

    scsa笔记1常见的网络安全术语0day通常是指还没有补丁的漏洞。也就是说官方还没有发现或者是发现了还没有开发出安全补丁的漏洞exploit简称exp,漏洞利用APT攻击高级持续性威胁。利用先进的攻击手段对特定目标进行长期持续性网络攻击的攻击形式1.1信息安全脆弱性及常见安全攻击网络环境的开放性在这里插入图片描述协议栈的脆弱性及常见攻击截获嗅探(sniffing)监听(eavesdropping)篡改数据包篡改(tampering)中断拒绝服务(dosing)伪造欺骗(spoof

    2022年6月20日
    37
  • 最大似然估计详解

    最大似然估计详解&nbsp&nbsp最大似然估计是建立在最大似然原理的基础之上。最大似然原理的直观理解是:设一个随机试验有若干个可能的结果A1,A2,…,An,在一次试验中,结果Ak出现,则一般认为实验对Ak的出现最有利,即Ak出现的概率较大。这里用到了”概率最大的事件最可能出现”的直观想法,然后对Ak出现的概率公式求极大值,这样便可解未知参数。下面用一个例子说明最大似然估计的思想方法。&nbsp&nbsp假设一个

    2022年10月29日
    0
  • MapReduce 编程不可怕,一篇文章搞定它

    MapReduce 编程不可怕,一篇文章搞定它前言本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系正文需求:WordCount,大数据领域的HelloWorld。Mapperpackagecom.shockang.study.bigdata.mapreduce;importjava.io.IOException;importorg.apache.hadoop.io.IntWr

    2022年6月14日
    27
  • 一个简单完整的网页密码_简单的个人网页

    一个简单完整的网页密码_简单的个人网页获得源码链接,点击这里网页头部+banner和信息部分+新闻部分+底部一头部效果:先对css进行初始化分析:头部有一张图片和一个input输入框还有一个按钮+下面的通栏因为用到左浮,右浮的地方不同我们可以写一个通类这里的logo图片如果不定义宽高会影响下面的通栏的设置,影响其中的第一个为首的顺序无法对齐二、通栏(宽度为适应屏幕所以是10…

    2022年10月13日
    0
  • nginx启动成功_centos重启服务器命令

    nginx启动成功_centos重启服务器命令文章目录启动Nginx停止nginxservice服务脚本Nginx开机自启启动Nginxnginx安装完成后,切换到nginx安装目录中的sbin目录(如果在执行./configure没有指定额外的参数,则sbin目录为默认目录,否则切换到自定义目录),通过执行该目录下nginx编译后的二进制文件即可启动程序。cd/usr/local/nginx/sbin/nginx./nginx执行上面的操作后,成功启动nginx,程序是没有任何提示的。我们可以使用ps命令查看nginx的运行状态

    2022年8月13日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号