基于keras的手写数字识别_数字识别

全栈程序员-站长 • 2025年11月14日下午2:43 • 未分类 • 阅读 8

基于keras的手写数字识别_数字识别一、概述手写数字识别通常作为第一个深度学习在计算机视觉方面应用的示例，Mnist数据集在这当中也被广泛采用，可用于进行训练及模型性能测试；模型的输入为：32*32的手写字体图片，这些手写字体包含0~9数字，也就是相当于10个类别的图片模型的输出：分类结果，0~9之间的一个数下面通过多层感知器模型以及卷积神经网络的方式进行实现二、基于多层感知器的手写数字识别多层感知器的模型如下…

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元售后保障童叟无欺

一、概述

手写数字识别通常作为第一个深度学习在计算机视觉方面应用的示例，Mnist数据集在这当中也被广泛采用，可用于进行训练及模型性能测试；
模型的输入： 32*32的手写字体图片，这些手写字体包含0~9数字，也就是相当于10个类别的图片
模型的输出：分类结果，0~9之间的一个数
下面通过多层感知器模型以及卷积神经网络的方式进行实现

二、基于多层感知器的手写数字识别

多层感知器的模型如下，其具有一层影藏层：

784个神经元	784个神经元	10个神经元
输入层	影藏层	输出层

Mnist数据集此前可通过mnist.load_data()进行下载，但网址打不开，因此通过其他方式将数据集下载到本地，并在本地进行读取，数据集下载链接为：链接: https://pan.baidu.com/s/1ZlktkjqEGEJ0aZGQBQuqXg 提取码: br96
改编后的数据读取方式如下：

import numpy as np def loadData(path="mnist.npz"): f = np.load(path) x_train, y_train = f['x_train'], f['y_train'] x_test, y_test = f['x_test'], f['y_test'] f.close() return (x_train, y_train), (x_test, y_test) # 从Keras导入Mnist数据集 (x_train, y_train), (x_validation, y_validation) = loadData()

完整的实现代码如下：

import matplotlib.pyplot as plt import numpy as np from keras.models import Sequential from keras.layers import Dense from keras.utils import np_utils def loadData(path="mnist.npz"): f = np.load(path) x_train, y_train = f['x_train'], f['y_train'] x_test, y_test = f['x_test'], f['y_test'] f.close() return (x_train, y_train), (x_test, y_test) # 从Keras导入Mnist数据集 (x_train, y_train), (x_validation, y_validation) = loadData() # 显示4张手写数字图片 plt.subplot(221) plt.imshow(x_train[0], cmap=plt.get_cmap('gray')) plt.subplot(222) plt.imshow(x_train[1], cmap=plt.get_cmap('gray')) plt.subplot(223) plt.imshow(x_train[2], cmap=plt.get_cmap('gray')) plt.subplot(224) plt.imshow(x_train[3], cmap=plt.get_cmap('gray')) plt.show() # 设定随机种子 seed = 7 np.random.seed(seed) num_pixels = x_train.shape[1] * x_train.shape[2] print(num_pixels) x_train = x_train.reshape(x_train.shape[0], num_pixels).astype('float32') x_validation = x_validation.reshape(x_validation.shape[0], num_pixels).astype('float32') # 格式化数据到0~1 x_train = x_train/255 x_validation = x_validation/255 # 进行one-hot编码 y_train = np_utils.to_categorical(y_train) y_validation = np_utils.to_categorical(y_validation) num_classes = y_validation.shape[1] print(num_classes) # 定义基准MLP模型 def create_model(): model = Sequential() model.add(Dense(units=num_pixels, input_dim= num_pixels,kernel_initializer='normal', activation='relu')) model.add(Dense(units=num_classes, kernel_initializer='normal', activation='softmax')) # 编译模型 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) return model model = create_model() model.fit(x_train, y_train, epochs=10, batch_size=200) score = model.evaluate(x_validation, y_validation) print('MLP: %.2f%%' % (score[1]*100))

程序运行结果如下

784 10 Epoch 1/10 200/60000 [..............................] - ETA: 4:32 - loss: 2.3038 - acc: 0.1100 600/60000 [..............................] - ETA: 1:37 - loss: 2.0529 - acc: 0.3283 1000/60000 [..............................] - ETA: 1:02 - loss: 1.8041 - acc: 0.4710 ... 9472/10000 [===========================>..] - ETA: 0s 10000/10000 [==============================] - 1s 112us/step MLP: 98.07%

三、基于卷积神经网络的手写数字识别

构建的卷积神经网络结构如下：

1 x 28 x 28个输入	32maps, 5 x 5	2 x 2	20%		128个	10个
输入层	卷积层	池化层	Dropout层	Flatten层	全连接层	输出层

Flatten层: Flatten层用来将输入“压平”，即把多维的输入一维化，常用在从卷积层到全连接层的过渡,举例如下

input size	—->>	output size
32 x 32 x 3	Flatten–>	3072

完整的实现代码如下：

import numpy as np from keras.models import Sequential from keras.layers import Dense from keras.layers import Dropout from keras.layers import Flatten from keras.layers.convolutional import Conv2D from keras.layers.convolutional import MaxPooling2D from keras.utils import np_utils from keras import backend backend.set_image_data_format('channels_first') def loadData(path="mnist.npz"): f = np.load(path) x_train, y_train = f['x_train'], f['y_train'] x_test, y_test = f['x_test'], f['y_test'] f.close() return (x_train, y_train), (x_test, y_test) # 从Keras导入Mnist数据集 (x_train, y_train), (x_validation, y_validation) = loadData() # 设定随机种子 seed = 7 np.random.seed(seed) x_train = x_train.reshape(x_train.shape[0], 1, 28, 28).astype('float32') x_validation = x_validation.reshape(x_validation.shape[0], 1, 28, 28).astype('float32') # 格式化数据到0~1 x_train = x_train/255 x_validation = x_validation/255 # 进行one-hot编码 y_train = np_utils.to_categorical(y_train) y_validation = np_utils.to_categorical(y_validation) # 定义模型 def create_model(): model = Sequential() model.add(Conv2D(32, (5, 5), input_shape=(1, 28, 28), activation='relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Dropout(0.2)) model.add(Flatten()) model.add(Dense(units=128, activation='relu')) model.add(Dense(units=10, activation='softmax')) # 编译模型 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) return model model = create_model() model.fit(x_train, y_train, epochs=10, batch_size=200, verbose=2) score = model.evaluate(x_validation, y_validation, verbose=0) print('CNN_Small: %.2f%%' % (score[1]*100))

运行结果如下（明显感觉到运行时间较长）：

Epoch 1/10 - 165s - loss: 0.2226 - acc: 0.9367 Epoch 2/10 - 163s - loss: 0.0713 - acc: 0.9785 Epoch 3/10 - 165s - loss: 0.0512 - acc: 0.9841 Epoch 4/10 - 165s - loss: 0.0391 - acc: 0.9880 Epoch 5/10 - 166s - loss: 0.0325 - acc: 0.9900 Epoch 6/10 - 162s - loss: 0.0268 - acc: 0.9917 Epoch 7/10 - 164s - loss: 0.0221 - acc: 0.9928 Epoch 8/10 - 161s - loss: 0.0190 - acc: 0.9943 Epoch 9/10 - 162s - loss: 0.0156 - acc: 0.9950 Epoch 10/10 - 162s - loss: 0.0143 - acc: 0.9959 CNN_Small: 98.87%

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/194000.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

VUE双向绑定原理_vue的数据绑定怎么实现

上一篇 2025年11月14日下午2:22

进程分析工具 process_grep查看进程

下一篇 2025年11月14日下午3:01

claude code

windows 环境 Claude Code安装和使用教程

windows 环境 Claude Code安装和使用教程

Ai探索者
2026年3月15日
2
jsp实现图书管理系统

jsp实现图书管理系统图书管理系统根据对图书管理业务的分析给出图书管理系统功能设计如下 1 系统管理模块系统管理包括用户登录退出功能 2 借书规则管理模块管理员可以对借书规则可借多少天可借多少本超期一天罚款多少信息进行修改和查看读者可以查看借书规则 3 图书类型管理模块管理员可以对图书分类信息进行增删改查操作图书分类名称唯一 4 图书信息管理模块管理员可以对图书信息进行增删改查操作读者可以查看图书信息 5 读者信息管理模块管理员可以对读者信息进行增删改查操作读者登录后可以查看个人信息以

全栈程序员-站长
2025年11月16日
7
实现labelme批量json_to_dataset方法

实现labelme批量json_to_dataset方法labelme可以帮助我们快速的实现Mask-RCNN中数据集json文件的生成，然而还需要我们进一步的将json转成dataset，可以直接在cmd中执行labelme_json_to_dataset.exeC:\Users\Administrator\Desktop\total\1.json(路径)，但是这个过程需要我们一个json文件的生成，过程很慢。一、打开abelm…

全栈程序员-站长
2025年10月25日
3
编写 portlet

编写 portlet本节向您介绍有关创建 portlet 的概念从一个彻底修改过的简单的 portlet 开始使用有关 PortletAPI 的节和 Javadoc 作为参考创建简单 portlet 实例 portlet 样本设置 portlet 开发环境 HelloWorldpo 编译 Java 源代码封装和部署 portlet 生成标记使用持久性

全栈程序员-站长
2026年3月17日
1
MFC中模态对话框和非模态对话框的区别

MFC中模态对话框和非模态对话框的区别MFC 中对话框有两种形式一个是模态对话框 modeldialogb 一个是非模态对话框 modelessdial 二者的区别在于当对话框打开时是否允许用户进行其他对象的操作一模态对话框 modeldialogb 在程序运行的过程中若出现了模态对话框那么主窗口将无法发送消息直到模态对话框退出才可以发送点击模态对话框中的 OK 按钮模态对话框会被销毁

全栈程序员-站长
2026年3月19日
3
amoeba mysql下载_amoeba for mysql

amoeba mysql下载_amoeba for mysql安装 amoebaformys 对于 amoeba 的安装是相当简单的基本上没什么安装的只需要解压文件然后设置下环境变量就行了 vi etc profileexpor home01 home software amoeba mysql 3 0 5 RCexportPATH PATH amoeba home01 bin 添加完环境变量周执行 source etc

全栈程序员-站长
2026年3月16日
2

发表回复

关注全栈程序员社区公众号