多层感知机实现(单层感知器和多层感知器)

前面利用了softmax来对图像进行分类,也可以使用多层感知机的方法对图像进行分类。多层感知机从零开始实现方法多层感知机(multilayerperceptron,MLP),在单层神经网络的基础上引入了一到多个隐藏层(hiddenlayer)。对于图中的感知机来说,它含有一个隐藏层,该层中有5个隐藏单元。输入和输出个数分别为4和3,中间的隐藏层中包含了5个隐藏单元。…

大家好,又见面了,我是你们的朋友全栈君。

前面利用了softmax来对图像进行分类,也可以使用多层感知机的方法对图像进行分类。

多层感知机从零开始实现方法

多层感知机(
multilayer perceptron

MLP),在单层神经网络的基础上引入了一到多个隐藏层(hidden layer)。
 
多层感知机实现(单层感知器和多层感知器)
 
对于图中的感知机来说,
它含有一个隐藏层,该层中有
5个隐藏单元。输入和输出个数分别为
4

3
,中间的隐藏层中包含了
5个隐藏单元。由于输入层不涉及计算,图
中的多层感知机的层数为
2
隐藏层位于输入层和输出层之间。
隐藏层中
的神经元和输入层中各个输入完全连接,输出层中的神经元和隐藏层中的各个神经元也完全连接。因
此,多层感知机中的隐藏层和输出层都是全连接层。
 

1.导入包

import torch
import numpy as np
import sys
sys.path.append("..") # 为了导入上层目录的d2lzh_pytorch
import d2lzh_pytorch as d2l

print(torch.__version__)

2.获取和读取数据

使用
Fashion-MNIST
数据集。我们将使用多层感知机对图像进行分类。
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

3.定义模型参数

Fashion-MNIST
数据集中图像形状为 28×28,类别数为10
。本节中我们依然使用长度为 28×28=784的向量表示每一张图像。因此,输入个数为784
,输出个数为
10
。实验中,我们设超参数隐藏单元个数为
256
num_inputs, num_outputs, num_hiddens = 784, 10, 256

W1 = torch.tensor(np.random.normal(0, 0.01, (num_inputs, num_hiddens)), dtype=torch.float)
b1 = torch.zeros(num_hiddens, dtype=torch.float)
W2 = torch.tensor(np.random.normal(0, 0.01, (num_hiddens, num_outputs)), dtype=torch.float)
b2 = torch.zeros(num_outputs, dtype=torch.float)

params = [W1, b1, W2, b2]
for param in params:
    param.requires_grad_(requires_grad=True)

4.定义激活函数

使用基础的
max
函数来实现
ReLU
,而非直接调用
relu
函数。
def relu(X):
    return torch.max(input=X, other=torch.tensor(0.0))

5.定义模型

通过
view
函数将每张原始图像改成长度为
num_inputs
的向量。然后我们实现上一节中多层感知机的计算表达式。
def net(X):
    X = X.view((-1, num_inputs))
    H = relu(torch.matmul(X, W1) + b1)
    return torch.matmul(H, W2) + b2

6.定义损失函数

直接使用
PyTorch
提供的包括
softmax运算和交叉熵损失计算的函数。
loss = torch.nn.CrossEntropyLoss()

7.训练模型

num_epochs, lr = 5, 100.0
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, params, lr)

多层感知机实现(单层感知器和多层感知器)

简洁实现的方法:

1.定义模型

num_inputs, num_outputs, num_hiddens = 784, 10, 256
    
net = nn.Sequential(
        d2l.FlattenLayer(),
        nn.Linear(num_inputs, num_hiddens),
        nn.ReLU(),
        nn.Linear(num_hiddens, num_outputs), 
        )
    
for params in net.parameters():
    init.normal_(params, mean=0, std=0.01)

2.读取数据并训练模型

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
loss = torch.nn.CrossEntropyLoss()

optimizer = torch.optim.SGD(net.parameters(), lr=0.5)

num_epochs = 5
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/128148.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月16日 上午10:20
下一篇 2022年4月16日 上午10:20


相关推荐

  • java前端开发自动生成器_一个简单实用的java代码生成器

    java前端开发自动生成器_一个简单实用的java代码生成器做现在这破项目boss还觉得进度慢,时间其实都浪费在了基础的CRUD上了,一个上午好不容易调通从action到service在到dao在到数据库的crud。工欲善其事必先利其器,有一款趁手的工具可有效提高开发效率,推荐一个简单实用的在线java代码生成器。代码生成器只是xjr快速开发框架功能的一部分。这款代码生成器是一款国内最新自主研发的JAVA代码自动生成器,目前来看这是一款十分赞的代码…

    2022年5月23日
    48
  • 什么是大数据架构?需要学什么内容?[通俗易懂]

    什么是大数据架构?需要学什么内容?[通俗易懂]大数据架构设计用来处理对传统数据库系统而言太大或太复杂的数据的引入、处理和分析。组织进入大数据领域的门槛各不相同,具体取决于用户的权限及其工具的功能。对某些组织来说,大数据可能意味着数百个GB的数据,而对另一些组织来说,大数据则意味着数百个TB的数据。随着处理大数据集的工具的发展,大数据的涵义也在不断地变化。慢慢地,这个术语更多的是指通过高级分析从数据集获取的价值,而不是严格地指数据的大小…

    2022年5月16日
    40
  • 怎么判断摄像头开没开_qt获取控制台输出并显示

    怎么判断摄像头开没开_qt获取控制台输出并显示一、系统环境介绍PC环境:ubuntu18.04Android版本:8.1Android设备:友善之臂RK3399开发板摄像头:罗技USB摄像头FFMPEG版本:4.2.2NDK版本:R19CQT版本:5.12二、QT代码关于FFMPEG库的编译、QT的环境搭建等问题,可以看上篇文章。直接上核心代码:#include”main…

    2025年12月7日
    8
  • navict15激活码【在线注册码/序列号/破解码】

    navict15激活码【在线注册码/序列号/破解码】,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月18日
    42
  • 不止编码,还要好好生活和思考[通俗易懂]

    做一个积极的人编码、改bug、提升自己我有一个乐园,面向编程,春暖花开!2019年4月最后一天,不写技术,谈谈我的乐园,我喜欢的一首诗,分享给你!面朝大海,春暖花开[作者] 海子从明天起,做一个幸福的人喂马,劈柴,周游世界从明天起,关心粮食和蔬菜我有一所房子,面朝大海,春暖花开从明天起,和每一个亲人通信告诉他们我的幸福那幸福的闪电告诉我的我将告诉每一个人给每一条河…

    2022年3月1日
    47
  • mysql查看查询慢的语句_sql慢查询如何优化

    mysql查看查询慢的语句_sql慢查询如何优化Mysql慢查询设置分析MySQL语句查询性能的方法除了使用EXPLAIN输出执行计划,还可以让MySQL记录下查询超过指定时间的语句,我们将超过指定时间的SQL语句查询称为“慢查询”。=========================================================方法一:这个方法我正在用,呵呵,比较喜欢这种即时性的。Mysql5.0以上的版本可以支持将执行…

    2022年10月14日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号