Python ‘gbk’ codec can’t decode byte 0x80[通俗易懂]

Python ‘gbk’ codec can’t decode byte 0x80[通俗易懂]Python‘gbk’codeccan’tdecodebyte0x80前段时间,运行得好好的Python代码突然抛出如下错误:Traceback(mostrecentcalllast):File"C:\***\tools.py",line367,in__get_key_from_symline=file.readline()F…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

Python ‘gbk’ codec can’t decode byte 0x80

前段时间,运行得好好的 Python 代码突然抛出如下错误:

Traceback (most recent call last):
  File "C:\***\tools.py", line 367, in __get_key_from_sym
    line = file.readline()
  File "C:\Python\Python35-32\lib\codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 3223: invalid start byte

从错误提示来看,应该是文件编码的问题,文件中含有 gbk 无法解码的内容,某个字符的起始字节为 0x80,不在 gbk 的编解码范围内。其对应的源码如下:

@staticmethod def __get_key_from_sym(sym): with open(sym) as file: line = file.readline() if line: keys = line.split() if len(keys) >= 4: return keys[3] 

如上代码所示,先是以文件流的形式打开 sym 文件,然后逐行读取文件,直至找到所需内容。错误出在 line = file.readline() 一行,原因在于其上一行 open(sym) 使用的编解码格式不适合。在未指定编解码格式的情况下,open(sym) 会使用平台相关的编解码器来解析文件,此处使用的是 gbk ,而 0x80 不是 gbk 能够识别的起始字节。

解决方案

尝试将编解码格式设置为 UTF8 等,即 with open(sym, encoding='UTF8') as file,仍然无法解决问题。虽然无法确定 sym 文件的编码格式,但是此处所需的内容在文件的首行,可以确保的是首行中没有无法识别的特殊字符,所以可以先以 二进制 方式打开文件,然后将读取出来的内容使用某个格式来解码:

@staticmethod def __get_key_from_sym(sym): with open(sym, "rb") as file: # 文件编码不确定,以二进制方式打开 line = file.readline() if line: keys = line.decode("utf-8").split() # 尝试用 utf-8 来解码(相关行无特殊字符) if len(keys) >= 4: return keys[3] 

当然,此处只是规避了问题,如果要从根本上解决问题,还是要选择合适的编解码格式。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/197608.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • CountDownTimer_bytebuffer slice

    CountDownTimer_bytebuffer slicepublicclassCountDownTimerManager{/***总倒计时*/privatelongmillisInFuture=0;/***回调时间*/privatelongcountDownInterval;/***倒计时完成回调*/privateFinishCountDownfinishCountDown;/**

    2022年9月18日
    2
  • poj 4044 Score Sequence(暴力)

    poj 4044 Score Sequence(暴力)

    2021年12月4日
    38
  • kafka删除topic中的数据_kafka删除数据

    kafka删除topic中的数据_kafka删除数据删除topic里面的数据这里没有单独的清空数据的命令,这里要达到清空数据的目的只需要以下步骤:一、如果当前topic没有使用过即没有传输过信息:可以彻底删除。二、如果当前topic有使用过即有过传输过信息:并没有真正删除topic只是把这个topic标记为删除(markedfordeletion)。想要彻底删除topic数据要经过下面两个步骤:①:删除topic,重新用创建to…

    2022年10月16日
    2
  • java激活码_在线激活

    (java激活码)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~https://javaforall.net/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~S32P…

    2022年3月26日
    80
  • linux安装windows系统_deepin安装wine

    linux安装windows系统_deepin安装wine一、安装1.参考网站:https://www.jianshu.com/p/809c0de6fc31https://github.com/askme765cs/Wine-QQ-TIM2.步骤:先下载WineQQ压缩包:wineQQ9.0.3_23729.tar.xz$sudoadd-apt-repositoryppa:wine/wine-builds$sudoapt-get…

    2022年9月6日
    5
  • 傅里叶变换时域频域关系_傅里叶变换卷积性质

    傅里叶变换时域频域关系_傅里叶变换卷积性质我保证这篇文章和你以前看过的所有文章都不同,这是2012年还在果壳的时候写的,但是当时没有来得及写完就出国了……于是拖了两年,嗯,我是拖延症患者……这篇文章的核心思想就是:要让读者在不看任何数学公式的情况下理解傅里叶分析。傅里叶分析不仅仅是一个数学工具,更是一种可以彻底颠覆一个人以前世界观的思维模式。但不幸的是,傅里叶分析的公式看起来太复杂了,所以很多大一新生上来就懵圈并从此对…

    2022年10月7日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号