使用pandas读取csv文件的指定列

使用pandas读取csv文件的指定列根据教程实现了读取 csv 文件前面的几行数据 一下就想到了是不是可以实现前面几列的数据 经过多番尝试总算试出来了一种方法 之所以想实现读取前面的几列是因为我手头的一个 csv 文件恰好有后面几列没有可用数据 但是却一直存在着 原来的数据如下 GreydeMac mini chapter06gre catdata csv nbsp 1 name 01 coment 01 2

根据教程实现了读取csv文件前面的几行数据,一下就想到了是不是可以实现前面几列的数据。经过多番尝试总算试出来了一种方法。

之所以想实现读取前面的几列是因为我手头的一个csv文件恰好有后面几列没有可用数据,但是却一直存在着。原来的数据如下:

GreydeMac-mini:chapter06 greyzhang$ cat data.csv 

1,name_01,coment_01,,,,

2,name_02,coment_02,,,,

3,name_03,coment_03,,,,

4,name_04,coment_04,,,,

5,name_05,coment_05,,,,

6,name_06,coment_06,,,,

7,name_07,coment_07,,,,

8,name_08,coment_08,,,,

9,name_09,coment_09,,,,

10,name_10,coment_10,,,,

11,name_11,coment_11,,,,

12,name_12,coment_12,,,,

13,name_13,coment_13,,,,

14,name_14,coment_14,,,,

15,name_15,coment_15,,,,

16,name_16,coment_16,,,,

17,name_17,coment_17,,,,

18,name_18,coment_18,,,,

19,name_19,coment_19,,,,

20,name_20,coment_20,,,,

21,name_21,coment_21,,,,



如果使用pandas读取出全部的数据,打印的时候会出现以下结果:

In [41]: data = pd.read_csv(‘data.csv’)



In [42]: data

Out[42]: 

     1  name_01  coment_01  Unnamed: 3  Unnamed: 4  Unnamed: 5  Unnamed: 6

0    2  name_02  coment_02         NaN         NaN         NaN         NaN

1    3  name_03  coment_03         NaN         NaN         NaN         NaN

2    4  name_04  coment_04         NaN         NaN         NaN         NaN

3    5  name_05  coment_05         NaN         NaN         NaN         NaN

4    6  name_06  coment_06         NaN         NaN         NaN         NaN

5    7  name_07  coment_07         NaN         NaN         NaN         NaN

6    8  name_08  coment_08         NaN         NaN         NaN         NaN

7    9  name_09  coment_09         NaN         NaN         NaN         NaN

8   10  name_10  coment_10         NaN         NaN         NaN         NaN

9   11  name_11  coment_11         NaN         NaN         NaN         NaN

10  12  name_12  coment_12         NaN         NaN         NaN         NaN

11  13  name_13  coment_13         NaN         NaN         NaN         NaN

12  14  name_14  coment_14         NaN         NaN         NaN         NaN

13  15  name_15  coment_15         NaN         NaN         NaN         NaN

14  16  name_16  coment_16         NaN         NaN         NaN         NaN

15  17  name_17  coment_17         NaN         NaN         NaN         NaN

16  18  name_18  coment_18         NaN         NaN         NaN         NaN

17  19  name_19  coment_19         NaN         NaN         NaN         NaN

18  20  name_20  coment_20         NaN         NaN         NaN         NaN

19  21  name_21  coment_21         NaN         NaN         NaN         NaN



所说在学习的过程中这并不会给我带来什么障碍,但是在命令行终端界面呆久了总喜欢稍微清爽一点的风格。使用read_csv的参数usecols能够在一定程度上减少这种混乱感。

In [45]: data = pd.read_csv(‘data.csv’,usecols=[0,1,2,3])



In [46]: data

Out[46]: 

     1  name_01  coment_01  Unnamed: 3

0    2  name_02  coment_02         NaN

1    3  name_03  coment_03         NaN

2    4  name_04  coment_04         NaN

3    5  name_05  coment_05         NaN

4    6  name_06  coment_06         NaN

5    7  name_07  coment_07         NaN

6    8  name_08  coment_08         NaN

7    9  name_09  coment_09         NaN

8   10  name_10  coment_10         NaN

9   11  name_11  coment_11         NaN

10  12  name_12  coment_12         NaN

11  13  name_13  coment_13         NaN

12  14  name_14  coment_14         NaN

13  15  name_15  coment_15         NaN

14  16  name_16  coment_16         NaN

15  17  name_17  coment_17         NaN

16  18  name_18  coment_18         NaN

17  19  name_19  coment_19         NaN

18  20  name_20  coment_20         NaN

19  21  name_21  coment_21         NaN



为了能够看到数据的边界,读取的时候显示了第一列无效的数据。正常的使用中,或许我们是想连上面结果中最后一列的信息也去掉的,那只需要在参数重去掉最后一列的列号。

In [47]: data = pd.read_csv(‘data.csv’,usecols=[0,1,2])



In [48]: data

Out[48]: 

     1  name_01  coment_01

0    2  name_02  coment_02

1    3  name_03  coment_03

2    4  name_04  coment_04

3    5  name_05  coment_05

4    6  name_06  coment_06

5    7  name_07  coment_07

6    8  name_08  coment_08

7    9  name_09  coment_09

8   10  name_10  coment_10

9   11  name_11  coment_11

10  12  name_12  coment_12

11  13  name_13  coment_13

12  14  name_14  coment_14

13  15  name_15  coment_15

14  16  name_16  coment_16

15  17  name_17  coment_17

16  18  name_18  coment_18

17  19  name_19  coment_19

18  20  name_20  coment_20

19  21  name_21  coment_21

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/227762.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午8:36
下一篇 2026年3月16日 下午8:36


相关推荐

  • mac系统 环境变量配置

    mac系统 环境变量配置1 mac 环境变量加载顺序 etc profile etc paths bash profile bash login profile bashrc etc 目录下面的是系统级的配置 目录下的是用户配置 etc profile 和 etc paths 是系统级别的 系统启动就会加载 后面几个是当前用户级的环境变量 后面 3 个按照从前往后的顺序读取 如果 bash profile 文件存在 则后面的几个文件就会被忽略不读了 如果 bash profile 文件不存在

    2026年3月19日
    3
  • 零基础教程:Cursor编辑器中文设置图解指南

    零基础教程:Cursor编辑器中文设置图解指南

    2026年3月16日
    2
  • Latex 公式换行 等号左对齐

    Latex 公式换行 等号左对齐Latex公式换行等号左对齐示例:\begin{equation}\begin{aligned}X^TXh-X^TY&=\begin{bmatrix}x_1&x_2&…&x_n\\1&1&…&1\end{bmatrix}\begin{bmatrix}x_1…

    2022年6月9日
    249
  • 惠普电脑u盘重装系统步骤_惠普电脑优盘装系统步骤「建议收藏」

    惠普电脑u盘重装系统步骤_惠普电脑优盘装系统步骤「建议收藏」惠普是一家全球性的科技公司,旗下有三大业务,计算机就是其中一种。购买惠普电脑的朋友不在少数,给我们提供了科技领先的产品和服务。那么惠普电脑如何安装系统呢?下面就教大家惠普电脑优盘装系统步骤,有需要的朋友们赶紧来学习一下吧。惠普电脑优盘装系统步骤阅读1、打开浏览器搜索云骑士官网,找到云骑士官网并点击打开。2、首先在官网下载云骑士一键重装系统软件,下载好以后打开云骑士装机大师。3、将U盘插在电脑的U…

    2022年8月13日
    8
  • python中random函数及用法

    python中random函数及用法1、python中的random函数random()方法返回随机生成的一个实数,它在[0,1)范围内importrandomrandom.random()#randint函数,返回指定范围的一个随机整数,包含上下限random.randint(0,99)#返回0~99之间的整数#randrange函数,randrange(0,101,2)可以用来选曲0~100之间的偶数2、…

    2022年6月9日
    34
  • form表单如何提交数据(表单中提交请求默认方式)

    Form表单提交数据的几种方式一、submit提交在form标签中添加Action(提交的地址)和method(post),且有一个submit按钮()就可以进行数据的提交,每一个input标签都需要有一个name属性,才能进行提交。当点击登陆时,向数据库发生的数据是:username=username&password=password.

    2022年4月12日
    82

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号