Python ‘gbk’ codec can’t decode byte 0x80[通俗易懂]

Python ‘gbk’ codec can’t decode byte 0x80[通俗易懂]Python‘gbk’codeccan’tdecodebyte0x80前段时间,运行得好好的Python代码突然抛出如下错误:Traceback(mostrecentcalllast):File"C:\***\tools.py",line367,in__get_key_from_symline=file.readline()F…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

Python ‘gbk’ codec can’t decode byte 0x80

前段时间,运行得好好的 Python 代码突然抛出如下错误:

Traceback (most recent call last):
  File "C:\***\tools.py", line 367, in __get_key_from_sym
    line = file.readline()
  File "C:\Python\Python35-32\lib\codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 3223: invalid start byte

从错误提示来看,应该是文件编码的问题,文件中含有 gbk 无法解码的内容,某个字符的起始字节为 0x80,不在 gbk 的编解码范围内。其对应的源码如下:

@staticmethod def __get_key_from_sym(sym): with open(sym) as file: line = file.readline() if line: keys = line.split() if len(keys) >= 4: return keys[3] 

如上代码所示,先是以文件流的形式打开 sym 文件,然后逐行读取文件,直至找到所需内容。错误出在 line = file.readline() 一行,原因在于其上一行 open(sym) 使用的编解码格式不适合。在未指定编解码格式的情况下,open(sym) 会使用平台相关的编解码器来解析文件,此处使用的是 gbk ,而 0x80 不是 gbk 能够识别的起始字节。

解决方案

尝试将编解码格式设置为 UTF8 等,即 with open(sym, encoding='UTF8') as file,仍然无法解决问题。虽然无法确定 sym 文件的编码格式,但是此处所需的内容在文件的首行,可以确保的是首行中没有无法识别的特殊字符,所以可以先以 二进制 方式打开文件,然后将读取出来的内容使用某个格式来解码:

@staticmethod def __get_key_from_sym(sym): with open(sym, "rb") as file: # 文件编码不确定,以二进制方式打开 line = file.readline() if line: keys = line.decode("utf-8").split() # 尝试用 utf-8 来解码(相关行无特殊字符) if len(keys) >= 4: return keys[3] 

当然,此处只是规避了问题,如果要从根本上解决问题,还是要选择合适的编解码格式。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/197608.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 《提问的智慧》

    《提问的智慧》https://www.jianshu.com/p/1b4ac73d4966

    2022年7月26日
    7
  • phpstorm 激活码 suspend[在线序列号]

    phpstorm 激活码 suspend[在线序列号],https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月18日
    67
  • Mysql 备份的三种方式

    Mysql 备份的三种方式备份的本质就是将数据集另存一个副本,但是原数据会不停的发生变化,所以利用备份只能回复到数据变化之前的数据。那变化之后的呢?所以制定一个好的备份策略很重要。一、备份的目的做灾难恢复:对损坏的数据进行恢复和还原需求改变:因需求改变而需要把数据还原到改变以前测试:测试新功能是否可用二、备份需要考虑的问题可以容忍丢失多长时间的数据;恢复数据要在多长时间内完;恢复的时候是否需要持续提供服务;恢复的对象,是整个库,多个表,还是单个…

    2022年6月15日
    32
  • SSRF漏洞介绍

    SSRF漏洞介绍小学用6年来期盼初中,初中用三年来渴望高中,高中用三年来憧憬大学,大学用四年来回忆小学到高中,青春就这样结束了。。。—-网易云热评一、SSRF漏洞介绍1、利用一个可以发起网络请求的服务,当做跳板来攻击其他服务。最常见的例子:通过WebInterface请求受保护网络内的资源。2、穿越网络防火墙的通行证二、SSRF漏洞的作用1、扫描内部网络2、向内部任意主机的任意端口发送精心构造的数据包3、DOS(请求大文件,始终保持连接Keep-AliveAlways)…

    2022年6月25日
    28
  • c语言createthread函数,C++中CreateThread函数创建线程的用法和实例

    c语言createthread函数,C++中CreateThread函数创建线程的用法和实例CreateThread是一种微软在WindowsAPI中提供了建立新的线程的函数,该函数在主线程的基础上创建一个新线程。线程终止运行后,线程对象仍然在系统中,必须通过CloseHandle函数来关闭该线程对象。需要调用到CRT库时,不要用CreateThread创建线程、并用CloseHandle来关闭这个线程,而应该用_beginthread来创建线程,_endthread来销毁线程。因为…

    2022年7月21日
    15
  • python把局部变量赋值给全局变量_局部变量不赋初值

    python把局部变量赋值给全局变量_局部变量不赋初值理解的都没问题。但我想聊聊出现这种情况的原因。在讲原因之前,需要先知道python中变量的搜索顺序,这个顺序是LGB(不考虑闭包情况)即local本地,global全局,builtin内建。比如:a=1deftest():a=3print(a)test()函数内声明了局部变量a,在打印中使用,在本地环境中命中,因此使用的是3。也许你会问这个知识点我早就知道了,这和本问题有什么关…

    2022年10月24日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号