python 导入数据错误:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb5 in position 0: invalid start

python 导入数据错误:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb5 in position 0: invalid start正想导入数据到python作分析找到这个教程https://www.cnblogs.com/OliverQin/p/8966321.html我要导入CSV文件,已经放在相同目录之下。importpandasaspddata=pd.read_csv("电信客户流失.csv",encoding="utf8")报错如下———————–…

大家好,又见面了,我是你们的朋友全栈君。

正想导入数据python作分析

找到这个教程

https://www.cnblogs.com/OliverQin/p/8966321.html

我要导入CSV文件,已经放在相同目录之下。

import pandas as pd
data = pd.read_csv("电信客户流失.csv",encoding="utf8")

报错如下

---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-5-6f8087e333bd> in <module>()
      1 import pandas as pd
----> 2 data = pd.read_csv("电信客户流失.csv",encoding="utf-8")

/usr/local/lib/python3.5/dist-packages/pandas/io/parsers.py in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipfooter, doublequote, delim_whitespace, low_memory, memory_map, float_precision)
    676                     skip_blank_lines=skip_blank_lines)
    677 
--> 678         return _read(filepath_or_buffer, kwds)
    679 
    680     parser_f.__name__ = name

/usr/local/lib/python3.5/dist-packages/pandas/io/parsers.py in _read(filepath_or_buffer, kwds)
    438 
    439     # Create the parser.
--> 440     parser = TextFileReader(filepath_or_buffer, **kwds)
    441 
    442     if chunksize or iterator:

/usr/local/lib/python3.5/dist-packages/pandas/io/parsers.py in __init__(self, f, engine, **kwds)
    785             self.options['has_index_names'] = kwds['has_index_names']
    786 
--> 787         self._make_engine(self.engine)
    788 
    789     def close(self):

/usr/local/lib/python3.5/dist-packages/pandas/io/parsers.py in _make_engine(self, engine)
   1012     def _make_engine(self, engine='c'):
   1013         if engine == 'c':
-> 1014             self._engine = CParserWrapper(self.f, **self.options)
   1015         else:
   1016             if engine == 'python':

/usr/local/lib/python3.5/dist-packages/pandas/io/parsers.py in __init__(self, src, **kwds)
   1706         kwds['usecols'] = self.usecols
   1707 
-> 1708         self._reader = parsers.TextReader(src, **kwds)
   1709 
   1710         passed_names = self.names is None

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader.__cinit__()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._get_header()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte

 

错误类型

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte

过了一会儿突然可以了,真实奇怪

python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

这时我在看这篇博客,

https://blog.csdn.net/xxceciline/article/details/80405129

然后我再次运行,又出现错误

python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

使用这个链接的方法

https://www.cnblogs.com/pengei/p/6407077.html

==========解决方案============

第一种:

  第一行加:# -*- coding: utf-8 -*-

第二种:

  引用处设置默认编码格式

  # coding: utf-8

第三种:

  使用中文处将中文unicode编码

python3以后第二种方式。

还是一样的报错

#-*- coding : utf-8 -*-
# coding: utf-8
import pandas as pd
data = pd.read_csv("电信客户流失.csv",encoding="utf-8")

python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

我尝试这个方法行不通

python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

在百度上的方法都解决不了,我用谷歌搜索解决方案

 

我的最终解决方案,来自这里

python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

 

#-*- coding : utf-8 -*-
# coding: utf-8
import pandas as pd
data = pd.read_csv("电信客户流失.csv",encoding="unicode_escape")

python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

说明刚才的错误没有了

 python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

用read_csv之后,里面加上encoding=’gbk’就可以了。

python 导入数据错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start 现在是什么问题都没有了

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/160459.html原文链接:https://javaforall.net

(0)
上一篇 2022年7月16日 下午9:16
下一篇 2022年7月16日 下午9:16


相关推荐

  • MutationObserver详解

    MutationObserver详解MutationObse 用来监视 DOM 变动 DOM 的任何变动 比如节点的增减 属性的变动 文本内容的变动都会触发 MutationObse 事件 但是 它与事件有一个本质不同 事件是同步触发 也就是说 DOM 的变动立刻会触发相应的事件 MutationObse 则是异步触发 DOM 的变动并不会马上触发 而是要等到当前所有 DOM 操作都结束才触发 MutationObse 有以下特点 它等待所有脚本任务完成后 才会运行 即异步触发方式 它把 DOM 变动

    2026年3月17日
    2
  • “养虾”大战再升级!阶跃星辰5万“小龙虾”免费送!OpenClaw概念股又要沸腾了!

    “养虾”大战再升级!阶跃星辰5万“小龙虾”免费送!OpenClaw概念股又要沸腾了!

    2026年3月13日
    2
  • Linux主机网卡绑定bond0详解

    Linux主机网卡绑定bond0详解 1什么是bond        网卡bond是通过多张网卡绑定为一个逻辑网卡,实现本地网卡的冗余,带宽扩容和负载均衡,在生产场景中是一种常用的技术。Kernels2.4.12及以后的版本均供bonding模块,以前的版本可以通过patch实现。可以通过以下命令确定内核是否支持bonding:…

    2022年4月8日
    289
  • Junit测试代码怎么写

    Junit测试代码怎么写Junit测试文件的编写先贴个简单的例子大家感受一下packagese.test;importstaticorg.junit.Assert.*;importjava.io.FileNotFoundException;importorg.junit.Test;importse.lab.Graph;importse.lab.Main;publicclassMainTest01{

    2025年6月5日
    5
  • conda换成中科大的源,2.更换Conda源「建议收藏」

    conda换成中科大的源,2.更换Conda源「建议收藏」#换源###1.Conda切换为清华源>condaconfig–addchannelshttps://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/>condaconfig–addchannelshttps://mirrors.tuna.tsinghua.edu.cn/anaconda/pkg…

    2026年4月15日
    9
  • Swagger 自定义UI界面

    Swagger 自定义UI界面Swagger 自定义 UI 界面 Swagger 简单介绍如何使用 Swagger 添加自定义 UI 界面使用 swagger ui layer

    2026年3月26日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号