怎么用python打开csv文件_使用Python从CSV文件读取数据

全栈程序员-站长 • 2022年7月20日下午11:46 • 未分类 • 阅读 24

怎么用python打开csv文件_使用Python从CSV文件读取数据CSV文件，也就是Comma-separatedValue文件，用sublime打开是这样（数据下载见文末）：如果用excel打开是这样（千万别点保存，保存就有问题）：来看看怎么打开，如果安装了anaconda，我们先打开JupyterNotebook，新建一个ipynb文件：我们看完数据了，应该从哪里开始？当然是从python官方文档开始！先搜下csv，找到不少结果，csv是python…

大家好，又见面了，我是你们的朋友全栈君。

CSV文件，也就是Comma-separated Value文件，用sublime打开是这样（数据下载见文末）：

csv文件.png

如果用excel打开是这样（千万别点保存，保存就有问题）：

csv文件excel-1.png

来看看怎么打开，如果安装了anaconda，我们先打开Jupyter Notebook，新建一个ipynb文件：

我们看完数据了，应该从哪里开始？当然是从python官方文档开始！先搜下csv，找到

不少结果，csv是python一个模块，有不少方法。要用这个库，就要导入，但是csv不支持Unicode输入。稳妥起见，还是选择unicodecsv模块。

如果要打开文件，应该是open这个关键词吧，搜一下，结果看起来好复杂！抽取下，发现基本格式是open(name[, mode[, buffering]])，name是欲打开文件的名字，mode是打开方式（r是读，w是写，如果没有这个参数那默认是r），当然加上b也是极好的，意思就是Opens a file for reading only in binary format。

buffering这个参数是可选参数，暂时不管。

open(name[, mode[, buffering]])

Open a file, returning an object of the file type described in section File Objects. If the file cannot be opened, IOError is raised. When opening a file, it’s preferable to use open() instead of invoking the file constructor directly.

找到了官方文档的例子

import csv

with open(‘some.csv’, ‘rb’) as f:

reader = csv.reader(f)

for row in reader:

print row

看起来可以直接用，我们试一试。

import unicodecsv

with open(‘enrollments.csv’, ‘rb’) as f:

reader = unicodecsv.reader(f)

for row in reader:

enrollments.append(row)

enrollments[0]

输出结果是[u’account_key’,u’status’,u’join_date’,u’cancel_date’,u’days_to_cancel’,u’is_udacity’,u’is_canceled’]，看起来像表头，我们再看看enrollments[1]是什么：

[u’448′, u’canceled’, u’2014-11-10′, u’2015-01-14′, u’65’, u’True’, u’True’]

还有enrollments[2]是什么

[u’448′, u’canceled’, u’2014-11-05′, u’2014-11-10′, u’5′, u’True’, u’True’]

原来是一行一行的读，是列表形式，不带表头的。如果我们想带表头怎么办？有一个方法，用DictReader，看看官方文档怎么说：

class csv.DictReader(csvfile, fieldnames=None, restkey=None, restval=None, dialect=’excel’, *args, **kwds)

Create an object which operates like a regular reader but maps the information read into a dict whose keys are given by the optional fieldnames parameter. The fieldnames parameter is a sequence whose elements are associated with the fields of the input data in order. These elements become the keys of the resulting dictionary.

好了，我们大概知道怎么写了。

csv读取-1-1024x200.png

简单解释一下代码意思，先整体看一下。

import unicodecsv

enrollments = []

f= open(‘enrollments.csv’, ‘rb’)

reader = unicodecsv.DictReader(f)

for row in reader:

enrollments.append(row)

f.close()

enrollments[0]

然后一句一句解读。

import unicodecsv

#导入unicodecsv模块，其实导入csv也行，只不过unicodecsv能够处理更多格式的字体

enrollments = []

#创建一个名为enrollments的列表，其实下面的reader这个迭代器也能够迭代，但只能迭代一次，后面我们需要多次用到迭代，

#所以我们创建一个列表，可以多次迭代

f= open(‘enrollments.csv’, ‘rb’)

reader = unicodecsv.DictReader(f)

#以只读方式打开enrollments.csv文件，写入到f文件句柄里

#以字典形式读取f文件句柄里的内容，写入到reader里，reader是一个迭代器（只能迭代一次）

for row in reader:

enrollments.append(row)

#开始for循环，使用append方法将文件的每一行添加到之前创建的enrollments列表里

f.close()

#关闭f文件句柄

enrollments[0]

#打印第一个元素

点击运行按钮，运行出现错误！报错为没有找到该文件，什么原因导致的呢？jupyter notebook工作路径导致的。需要将jupyter notebook工作路径和读取文件所在路径保持一致。

找不到路径-1024x357.png

我们需要将其工作路径调整到和enrollments.csv文件同一个路径下，使用”cd d:\anaconda“来改变notebook的工作路径，再次运行就可以了。

工作路径-1024x376.png

注意结果是一个字典，u’account_key’:u’448’这里的u表示unicode，本质上这里的448及所有的键值都是字符串类型。

我们可以简写这段代码，用‘with…as f’就可以省去f.close()这一句，即不需要再写关闭语句。

import unicodecsv

enrollments = []

with open(‘enrollments.csv’, ‘rb’) as f:

reader = unicodecsv.DictReader(f)

for row in reader:

enrollments.append(row)

enrollments[0]

另外，可以由更简便的方法把迭代器变成列表，由最初的8行变成了5行，输出结果一样。看看官方文档

class list([iterable])

Return a list whose items are the same and in the same order as iterable‘s items. iterable may be either a sequence, a container that supports iteration, or an iterator object. If iterable is already a list, a copy is made and returned, similar to iterable[:]. For instance, list(‘abc’) returns [‘a’, ‘b’, ‘c’] and list( (1, 2, 3) ) returns [1, 2, 3]. If no argument is given, returns a new empty list, [].

那我们就试试，这样就不用新建空列表：

import unicodecsv

with open(‘enrollments.csv’, ‘rb’) as f:

reader = unicodecsv.DictReader(f)

enrollments = list(reader)

enrollments[0]

如果需要读取多个文件，如果读取三个文件，就要把语句写3遍，后续debug也麻烦，这时候就需要考虑自己创建一个函数。

def read_csv(filename):

with open(filename, ‘rb’) as f:

reader = unicodecsv.DictReader(f)

return list(reader)

这样就能够读取不同的文件了。

enrollments = read_csv(‘enrollments.csv’)

daily_engagement = read_csv(‘daily_engagement.csv’)

project_submissions = read_csv(‘project_submissions.csv’)

数据文件下载，密码: 57h5

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/162501.html原文链接：https://javaforall.net

python 数据

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

合宙Air720U&724U&722U Lua 固件更新说明

上一篇 2022年7月20日下午11:46

Java xml节点属性的修改[通俗易懂]

下一篇 2022年7月20日下午11:46

Redis线程模型

Redis线程模型一概述 Redis 线程模型主要是基于 Reactor 模式开发的网络事件处理器这个处理器被称为文件事件处理器 fileeventhan 也就是说 Redis 线程模型指的就是文件事件处理器文件事件处理器是单线程模式运行的所以也叫单线程模型但是通过 IO 多路复用机制监听多个 socket 可以实现高性能的网络通信模型又可以跟内部其他单线程的模块进行对接保证了 redis 内部的线程模型的简单性二文件事件类型文件事件有两种类型读事件 AE READABLE 写事件 AE WRITABLE

全栈程序员-站长
2026年3月19日
2
CSS中的媒体类型media type[通俗易懂]

CSS中的媒体类型media type[通俗易懂]madiatype作用首先要明白一点，我们平时写的HTML页面，可能在不同的媒体类型中显示，如可能显示在屏幕sreen上，也可能显示在纸质print上。那么当页面在不同的媒体类型中显示时，需要的样式可能是不一样的。比如，一般在screen上显示时，页面字体要大一些，在纸质媒体显示时，页面字体要小一些。那么如何告诉别人某个样式是适用于何种媒体类型的呢？这就要靠声明mediatype来实现了。

全栈程序员-站长
2022年5月25日
94
如何使用腾讯云服务器搭建个人网站？[通俗易懂]

从刚开始的简单学习HTML语言，到进入实验室跟着老师，学长学习Java，Android，这一年收获很多，这并不是说我的编程能力得到了多高的提升，而是我认为自己的思路变得和以前不一样了，学会了很多解决问题的实际技巧，明白了思路远远比答案更重要，虽然这个学期离开了实验室，很遗憾，但一年的经历让我在解决其他问题的时候同样受益匪浅。在这个时候写这篇博客也是给自己一个交代，还记得当时学习编程的目的就是要做一个

全栈程序员-站长
2022年4月14日
248
php开源的客服系统_在线客服源码php

php开源的客服系统_在线客服源码php在线客服系统软件使开发和运营团队能够高速协作，因此要求源码系统能够快速响应业务变化，并快速提供出色的客户和员工服务体验。　　在线客服源码演示及获取：https://gitee.com/wang_li989/kfxt　　客服沟通问题加起来会成为重大的财务损失。您的组织快速有效地解决这些问题的能力直接影响到未满足的SLA义务和客户体验，这两个方面对公司的成功至关重要。在线客服系统是企业战略的核心组成部分。通过减少识别和解决问题所需的时间，您的组织可以提高客户忠诚度，最大限度地延长正常运行时间，并提供始终如

全栈程序员-站长
2022年4月19日
55
关于ICache和DCache

关于ICache和DCache从不同地方总结摘录而来附上原文链接原文 https blog csdn net article details nbsp nbsp ICache 和 DCache 是一种内存虽然目前接触了好几种内存寄存器 DDR 等它们在物理上的工作原理虽然不同但是访问属性却很像在速度上 nbsp CPU gt 寄存器 gt Cache gt DDR nbsp 在容量上 nbsp C

全栈程序员-站长
2026年3月26日
4
JavaScript 之自定义播放器

JavaScript 之自定义播放器自定义播放器自定义播放器自定义播放器自定义播放器的练习就是对事件的练习 html head metacharset utf 8 title 自定义播放器 title style progress height 30px border 2pxsoliddark progress gt bar height 100 style metacharset utf 8 head html

全栈程序员-站长
2026年3月17日
1

怎么用python打开csv文件_使用Python从CSV文件读取数据

关于作者

全栈程序员-站长

相关推荐

Redis线程模型

CSS中的媒体类型media type[通俗易懂]

如何使用腾讯云服务器搭建个人网站？[通俗易懂]

php开源的客服系统_在线客服源码php

关于ICache和DCache

JavaScript 之自定义播放器

发表回复