python3.8安装urllib库_urllib库的基本使用

python3.8安装urllib库_urllib库的基本使用学习爬虫的目的便是模拟浏览器向服务器发出请求 进而获取所需数据 爬虫可以分为抓取页面 分析页面和存储数据三步 每一步中 python 都有强大的模块来让我们使用 今天先来学习请求库 urllib 的基本使用 python 的安装请参考 python 开发环境搭建 安装 urllib 库 urllib 是 python 内置的库 一般不需要额外安装 方法一 win r 打开命令行 然后输入 pipinstallur

学习爬虫的目的便是模拟浏览器向服务器发出请求,进而获取所需数据。

爬虫可以分为抓取页面、分析页面和存储数据三步。

每一步中,python都有强大的模块来让我们使用。

今天先来学习请求库urllib的基本使用。

(python的安装请参考python开发环境搭建)

安装urllib库

(urllib是python内置的库,一般不需要额外安装)

方法一 win+r 打开命令行,然后输入pip install urllib安装urllib库。输入cmd打开命令行输入pip install urllib 回车,等待安装完成即可

在命令行中输入python进入python,

输入import urllib,若结果如下则说明urllib安装成功:urllib 安装成功

方法二:打开https://www.lfd.uci.edu/~gohlke/pythonlibs/#mysqlclient,找到对应版本的urllib的wheel文件,下载到本地,然后再用pip 安装即可(注意:下载的文件切不可重命名,要用绝对路径)。

使用urllib

urllib包含四个模块:request:HTTP请求模块,可以用来发送请求。

error :异常处理模块。

parse :提供了许多url处理方法,比如拆分、解析等。

robotparser :用的比较少,可以略过。利用最基本的urlopen()方法,可以完成最基本的简单网页的GET请求抓取。urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadefault=False,context=None)下面看一个具体的例子: 打开【西安天气】西安天气预报,蓝天,蓝天预报,雾霾,雾霾消散,天气预报一周,天气预报15天查询,打开开发者选项,我们可以看到网页源代码:浏览器显示结果在python IDEA运行上述代码

运行结果如下:运行结果

从图中可以看到,网页源代码就被下载下来了,通过解析网页源代码我们就可以获得我们想要的天气数据。

由于还没学到解析库,下面我们修改代码,用正则表达式来提取温度并绘图。

# -*-coding:utf-8 -*-

”’@author 马秋平urllib的 基本用法”’

from urllib.request import urlopen #导入urlopen

import re #正则模块

import matplotlib.pyplot as plt #用来绘图

import numpy as np #用来作矩阵运算

pattern = re.compile(r'(\d)+℃’)#构建正则匹配模式

url = ‘http://www.weather.com.cn/weather/101110101.shtml’ #链接

res = urlopen(‘http://www.weather.com.cn/weather/101110101.shtml’) #传入url,其他均为可选参数

result = res.read().decode(‘utf-8’)#打印网页源代码

temperature = re.findall(pattern,result)#用正则来匹配、获取温度

print(result) #打印网页源代码

print(temperature)#打印获取到的温度

data=[]#创建一个空列表用来存放温度

x=np.linspace(0,5,6) #x轴

for i in temperature:

data.append(int(i)) #类型转换,str–int

plt.scatter(x,data) #绘制散点图

plt.title(‘temperature’) #设置标题

plt.xticks(x,[‘2′,’3′,’4′,’5′,’6′,’7’])#设置x轴标注,代表日期

plt.xlabel(‘date’) #x轴标签

plt.grid(True) #显示网格线

plt.show()#显示绘图

运行结果如下

待更。。。。。。。。。

邮箱 :

欢迎交流,共同进步。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/220653.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 下午7:58
下一篇 2026年3月17日 下午7:58


相关推荐

  • matlab如何做正交多项式曲线拟合,matlab正交多项式拟合

    matlab如何做正交多项式曲线拟合,matlab正交多项式拟合在实验模态分析中用Matlab实现离散化正交多项式算法[C],马永列;陈章位;胡海清4.在实验模态分析中用Matlab实现离散化正交多项式算法[C],马永列……变换后的条件数上限表如下:拟合次数1=1cond2(A)2<9.93<50.34<435④在实际应用中还可以利用正交多项式求拟合多项式。一种方法是构造离散……..

    2025年5月24日
    3
  • 我花了500块安装OpenClaw,又花了200块卸载它

    我花了500块安装OpenClaw,又花了200块卸载它

    2026年3月13日
    1
  • trojangeneric木马_kali木马绑定app

    trojangeneric木马_kali木马绑定appKworker木马,如果发现root权限计划任务有以下这种非常规任务,说明已经中招成了矿机Dt环境,大家要注意,切莫随便给开放端口。Redis,与研发商量最好加上密码,矿机会在同网段扫描,一定要及时处理。按照以下方法清理,以下命令一起执行,不要分步骤,否则没有效果,可以写成个bash脚本,随大家心情。echo””>/etc/crontabrm-f/etc/cron.hourly/oanacronerrm-f/etc/cron.daily/oanacronerch…

    2026年3月9日
    5
  • 易语言时间戳转时间

    易语言时间戳转时间其实就是一行代码的事 返回类似于 2018 年 8 月 1 日几点几分几秒增减时间 到时间 1970 01 0100 00 00 秒 时间戳

    2026年3月17日
    2
  • git拉取代码命令

    git拉取代码命令gitclone 复制过来的 SSH

    2026年3月26日
    2
  • 群环域,理想商环,原根复习

    群环域,理想商环,原根复习包含了抽象代数里面的一些概念,最近看文章的时候一直反映不过来,理想是个啥来着,环和域的区别是啥来着。所以统筹整理一下。集合/(Set):一个集合GGG表示一组数据有限集合:G={a1,a2,…,an},∣G∣=nG=\{a_1,a_2,…,a_n\},|G|=nG={a1​,a2​,…,an​},∣G∣=n无穷集合:G={a1,a2,…},∣G∣=∞G=\{a_1,a_2,…\},|G|=\infinG={a1​,a2​,…},∣G∣=∞一个班级的所有学生半群/(Mo

    2022年6月18日
    38

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号