python csv文件数据写入和读取（适用于超大数据量）

全栈程序员-站长 • 2022年7月20日下午11:46 • 未分类 • 阅读 56

python csv文件数据写入和读取（适用于超大数据量）文章目录pythoncsv文件数据写入和读取（适用于超大数据量）pythoncsv文件数据写入和读取（适用于超大数据量）一般情况下由于我们使用的数据量比较小，因此可以将数据一次性整体读入或者写入，而且可以一次性对数据进行加工和处理。但是当数据量比较大，比如有5G的数据量，这个时候想要一次性对所有数据进行操作就比较困难了。所以需要逐条将数据进行处理。importcsv#在最开始创…

大家好，又见面了，我是你们的朋友全栈君。

文章目录

python csv文件数据写入和读取（适用于超大数据量）

python csv文件数据写入和读取（适用于超大数据量）

一般情况下由于我们使用的数据量比较小，因此可以将数据一次性整体读入或者写入，而且可以一次性对数据进行加工和处理。

但是当数据量比较大，比如有5G的数据量，这个时候想要一次性对所有数据进行操作就比较困难了。所以需要逐条将数据进行处理。

import csv

# 在最开始创建csv文件，并写入列名。相当于做一些准备工作
with open(savepath, 'w') as csvfile:         #以写入模式打开csv文件，如果没有csv文件会自动创建。
    writer = csv.writer(csvfile)
    # writer.writerow(["index","a_name","b_name"])  # 写入列名，如果没有列名可以不执行这一行
    # writer.writerows([[0, 1, 3], [1, 2, 3], [2, 3, 4]]) # 写入多行用writerows
  
 #如果你的数据量很大，需要在循环中逐行写入数据
 for i in range(100000):
	 with open(savepath, 'a+', newline='') as csvfile:      # a+表示以追加模式写入，如果用w会覆盖掉原来的数据。如果没有newline=''，则逐行写入的数据相邻行之间会出现一行空白。读者可以自己试一试。
	 csv_write = csv.writer(csvfile)
	 csv_write.writerow(row_data)    # 写入1行用writerow; row_data是你要写入的数据，最好是list类型。
 
 
f = open(savepath)
csv_read = csv.reader(f)
for line in csv_read:                # csv.reader(f)返回一个迭代器。迭代器的好处就是可以不用一次性将大量的数据都读进来，而是如果你需要一条，就给迭代器一个命令让它输出一条。关于迭代器的优点读者可以另行学习。
	print line

需要注意从csv文件读出来的数据是字符串，不是浮点数。使用float(str)完成转换。

# 也可以使用pandas读取csv文件
import pandas as pd

data = pd.read_csv(filepath, head=None, encoding='utf-8')   #data是一个dataframe对象
# 关于read_csv函数，这里并不做详细讲解。

data = data.values().astype('float32')  #将dataframe转换为数值矩阵

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/162498.html原文链接：https://javaforall.net

python 大数据数据

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

WiFi(6)和5G的区别及比对[通俗易懂]

上一篇 2022年7月20日下午11:46

Java中xml转义字符和gt,gte,lt,lte缩写

下一篇 2022年7月20日下午11:46

pycharm教育版申请_pycharm专业版学生免费吗

pycharm教育版申请_pycharm专业版学生免费吗前提准备：已经下载安装好了PyCharm专业版如果你还没下载，也别方张～嘻嘻嘻点击下面

全栈程序员-站长
2022年8月26日
8
文心一言

【OpenClaw从入门到精通】第01篇：保姆级教程——从零开始搭建你的第一个本地AI助理（2026实测版）

【OpenClaw从入门到精通】第01篇：保姆级教程——从零开始搭建你的第一个本地AI助理（2026实测版）

Ai探索者
2026年3月15日
2
多层感知器神经网络实例_多层感知器与bp神经网络

多层感知器神经网络实例_多层感知器与bp神经网络作者|VivekPatel编译|Flin来源|towardsdatascience除非你能学习到一些东西，否则不要重复造轮子。强大的库已经存在了，如：TensorFlow，PyTorch，Keras等等。我将介绍在Python中创建多层感知器（MLP）神经网络的基本知识。感知器是神经网络的基本组成部分。感知器的输入函数是权重，偏差和输入数据的线性组合。具体来说：in_j=weightinput+bias.(in_j=权重输入+偏差)。在每个感知器上，我们都可以指定一个激活函数g。

全栈程序员-站长
2022年8月30日
4
从零开始学习Prometheus监控报警系统[通俗易懂]

从零开始学习Prometheus监控报警系统[通俗易懂]Prometheus是一个开源的监控报警系统，它被纳入了由谷歌发起的Linux基金会旗下的云原生基金会，并成为仅次于Kubernetes的第二大开源项目。

全栈程序员-站长
2022年6月3日
35
openclaw

百度智能云发布零部署服务DuClaw：无需自行配置大模型

百度智能云发布零部署服务DuClaw：无需自行配置大模型

Ai探索者
2026年3月12日
2
文心一言

百度文心快码Baidu Comate全栈编程智能体使用手册：从入门到精通

百度文心快码Baidu Comate全栈编程智能体使用手册：从入门到精通

全栈程序员-站长
2026年3月12日
2

发表回复

关注全栈程序员社区公众号