mnist有多少张图片(怎么读取图片文字)

importosfromPILimportImageimportnumpyasnp#读取文件夹mnist下的42000张图片,图片为灰度图,所以为1通道,如果是将彩色图作为输入,则将1替换为3,图像大小28*28defload_data(): data=np.empty((42000,1,28,28),dtype="float32") label=np.em…

大家好,又见面了,我是你们的朋友全栈君。

    记录用不同的方法读取Mnist数据集

1、Python的PIL模块读取Mnist图片 

#读取文件夹mnist下的60000张图片,图片为灰度图,所以为1通道,如果是将彩色图作为输入,则将1替换为3,图像大小28*28
def load_data():
	data = np.empty((60000,1,28,28),dtype="float32")
	label = np.empty((60000,),dtype="uint8")
	imgs = os.listdir("E:\\DataSet\\mnist")
	num = len(imgs)
	for i in range(num):
		img = Image.open("E:\\DataSet\\mnist\\"+imgs[i])
		arr = np.asarray(img,dtype="float32")
		data[i,:,:,:] = arr
		label[i] = int(imgs[i].split('.')[0])
	#归一化和零均值化
	data /= np.max(data)
	data -= np.mean(data)
	return data,label

if __name__ == '__main__':
	load_data()

2、keras自带的 load_data( ) 方法

from keras.datasets import mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train.shape (60000, 28, 28),X_test.shape (10000, 28, 28);

y_train.shape (60000,),y_test.shape (10000,)。

这个方法未进行归一化,像素点数据范围是0-255。

参考:

http://keras-cn.readthedocs.io/en/latest/other/datasets/

https://github.com/wepe/MachineLearning/

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/129521.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • mysql如何查看表结构_linux登录mysql数据库

    mysql如何查看表结构_linux登录mysql数据库一、简单描述表结构,字段类型desctabl_name;显示表结构,字段类型,主键,是否为空等属性,但不显示外键。例如:desctable_name二、查询表中列的注释信息select*frominformation_schema.columnswheretable_schema=’db’#表所在数据库andtable_name=’tablename’;#你要查的表例如…

    2025年10月11日
    2
  • 第 3.3 节 Leetcode-Database 题解

    第 3.3 节 Leetcode-Database 题解

    2021年3月12日
    174
  • [行为识别论文详解]TSN(Temporal Segment Networks)[通俗易懂]

    [行为识别论文详解]TSN(Temporal Segment Networks)[通俗易懂]摘要本文旨在设计有效的卷积网络体系结构用于视频中的动作识别,并在有限的训练样本下进行模型学习。TSN基于two-stream方法构建。论文主要贡献:提出了TSN(TemporalSegmentNetworks),基于长范围时间结构(long-rangetemporalstructure)建模,结合了稀疏时间采样策略(sparsetemporalsamplingstrat…

    2022年6月21日
    54
  • mysql8分区表_MySQL 分区表[通俗易懂]

    mysql8分区表_MySQL 分区表[通俗易懂]MySQL分区就是将一个表分解为多个更小的表。从逻辑上讲,只有一个表或一个索引,但在物理上这个表或者索引可能由多个物理分区组成。每个分区在物理上都是独立的。MySQL数据库分区类型:Range分区:行数据基于属于一个给定连续区间的列值放入分区。List分区:和Range分区类似,只是List分区面向的是离散的值。Hash分区:根据用户自定义的表达式的返回值来进行分区,返回值不能为负数。Key分区:…

    2022年6月11日
    44
  • 查找-散列查找

    查找-散列查找1.散列的相关概念散列技术是在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使得每个关键字key对应一个存储位置f(key)。查找时,根据这个确定的对应关系找到给定值key的映射f(key),若查找集合中存在这个记录,则必定在f(key)的位置上。这里我们把这种对应关系f称为散列函数,又称为哈希(Hash)函数。按这个思想,采用散列技术将记录存储在一块连续的存储空间中,这块连续存储空间称为

    2022年5月14日
    47
  • C++ 数组求和_excel数组求和公式

    C++ 数组求和_excel数组求和公式C++数组求和用自带的库超级方便,而且也达到代码更加简洁的目的。你只需要做2步:1、导入库文件include2、添加空间名usingnamespacestd;然后就可以直接使用:accumulate(arrayName,arrayName+数组长度,数组起始位)demo:intarray[6]={1,2,3,4,5,6};in…

    2022年10月2日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号