Python3中urlopen()详解

Python3中urlopen()详解一 简介 urllib request urlopen 函数用于实现对目标 url 的访问 函数原型如下 urllib request urlopen url data None timeout cafile None capath None cadefault False context None url 需要打开的网址 data Post 提交的数

一.  简介

urllib.request.urlopen()函数用于实现对目标url的访问。

 

函数原型如下:urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None) 

url:  需要打开的网址

data:Post提交的数据

timeout:设置网站的访问超时时间

 

直接用urllib.request模块的urlopen()获取页面,page的数据格式为bytes类型,需要decode()解码,转换成str类型。

 

二.  函数参数介绍

 

1. url 参数:目标资源在网路中的位置。可以是一个表示URL的字符串(如:http://www.pythontab.com/);也可以是一个urllib.request对象,详细介绍请跳转

2. data参数:data用来指明发往服务器请求中的额外的参数信息(如:在线翻译,在线答题等提交的内容),data默认是None,此时以GET方式发送请求;当用户给出data参数的时候,改为POST方式发送请求。

3. timeout:设置网站的访问超时时间

4. cafile、capath、cadefault 参数:用于实现可信任的CA证书的HTTP请求。(基本上很少用)

5. context参数:实现SSL加密传输。(基本上很少用)

 

三. 返回处理方法详解

urlopen返回对象提供方法:

read() , readline() ,readlines() , fileno() , close() :对HTTPResponse类型数据进行操作

info():返回HTTPMessage对象,表示远程服务器返回的头信息

getcode():返回Http状态码。如果是http请求,200请求成功完成;404网址未找到

geturl():返回请求的url

 

四. 版本区别, 注意事项

python2和python3在导入urlrequest的方式都不一样。 

python2是这样:import urllib2 

而python3里面把urllib分开了,分成了urlrequest和urlerror,在这里我们只需导入urlrequest即可。from urllib.request import urlopen

 

五. 实例

下面这个程序,实现了urlopen()函数的大部分功能,特别是data参数。data自定义,data格式转换,数据的编码encode()和解码decode()。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

#coding=utf-8

#Python3.x

'''

利用有道翻译进行在线翻译

'''

import urllib.request

import urllib.parse

import json

def traslate(words):

    #目标URL

    targetURL = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=null"

    #用户自定义表单,words表示的是用户要翻译的内容。这里使用的是dict类型,也可以使用元组列表(已经试过的)。

    data = {}

    data['type'= 'AUTO'

    data['i'= words

    data['doctype'= 'json'

    data['xmlVersion'= '1.8'

    data['keyfrom'= 'fanyi.web'

    data['ue'= 'UTF-8'

    data['action'= 'FY_BY_CLICKBUTTON'

    data['typoResult'= 'true'

    #将自定义data转换成标准格式

    data = urllib.parse.urlencode(data).encode('utf-8')

    #发送用户请求

    html = urllib.request.urlopen(targetURL, data)

    #读取并解码内容

    rst = html.read().decode("utf-8")

    rst_dict = json.loads(rst)

    return rst_dict['translateResult'][0][0]['tgt']

if __name__ == "__main__":

    print("输入字母q表示退出")

    while True:

        words = input("请输入要查询的单词或句子:\n")

        if words == 'q':

            break

        result = traslate(words)

        print("翻译结果是:%s"%result)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/211796.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午9:35
下一篇 2026年3月18日 下午9:35


相关推荐

  • c语言必备100代码(代码大全)

    一个完全入门初学者如何学代码,读代码和写代码,,我想学代码不知道方向谁能给我指明一个方向?1、学代码:前提是你的复有一个比较系统的学习.认真完成每一个课程中的案例.2、读代码:分制两步走:前期能读懂自己写的代码.2113后期能读懂他人写的代码和大致的知道底层的某些源码的含义.多去5261看开发文档(开发文档建议使用官方提供的4102英文版、不要使用中文自己害自己)3、写代码1653:前提是你要有…

    2022年4月18日
    1.2K
  • 计算机信息计量单位kgm,工程单位换算表.pdf

    计算机信息计量单位kgm,工程单位换算表.pdf工程单位换算表流量计|论文|工程单位换算表流量计:蒸汽流量计|污水流量计|明渠式流量计|电磁流量计|靶式流量计|涡街|涡轮|流量积算仪产品信息样本下载调查问卷论坛留言关于我们产品价格招聘买马技术资料…

    2022年5月14日
    81
  • 【转载】lvs为何不能完全替代DNS轮询

    【转载】lvs为何不能完全替代DNS轮询

    2021年11月20日
    55
  • 如何获得select被选中option的value和text和……

    如何获得select被选中option的value和text和……

    2021年10月31日
    44
  • 协同过滤推荐算法(java原生JDK实现-附源码地址)

    协同过滤推荐算法(java原生JDK实现-附源码地址)一、项目需求1.需求链接https://tianchi.aliyun.com/getStart/information.htm?raceId=2315222.需求内容竞赛题目在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中,我们不仅需要利用用户在这

    2022年4月6日
    38
  • 数据库系统原理——概述「建议收藏」

    数据库系统原理——概述「建议收藏」穷则独善其身,达则兼济天下一.什么是数据库狭义:存储数据的仓库广义:可以对数据进行存储和管理的软件以及数据本身统称为数据库数据库是由表、关系、操作组成二.为什么需要数据库几乎所有的应用软件的后台都需要数据库数据存储数据占用空间小,容易持久保存数据库的内容是存储在硬盘上,掉电之后任然存在存储比较安全软件是加密的,只能通过DBMS打开容易维护和升级使用SQL语句方便操作数据数据库移植比较容易简化对数据的操作为将来学习Oracle做准备.

    2025年6月7日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号