感知机和多层感知机详细学习

全栈程序员-站长 • 2026年3月26日下午9:02 • 未分类 • 阅读 2

感知机和多层感知机详细学习1 感知机的前向推理感知机其实就是类似神经网络的一个神经元 w0 相当于 bias 也就是偏置 w1 wn 是权重 stepfuction 是 sign 前向推理的公式 2 感知机的 lossfunction 是什么 lossfunction 即目标函数模型所要去干的事情就是我们所定义的目标函数这里采用各个误分类点与超平面的距离来定义图中目前以输入为 2 维 x 为 x1 和 x2 情况下举例 w 为超平面的法向量与法向量夹角为锐角即为 1 的分类与法向量夹角为钝角为 1 的分类具体公式其

在这里插入图片描述

1. 感知机的前向推理？

在这里插入图片描述

感知机其实就是类似神经网络的一个神经元
w0相当于bias，也就是偏置
w1-wn是权重
step fuction是sign

2. 感知机的loss function是什么？

在这里插入图片描述
loss function即目标函数，模型所要去干的事情就是我们所定义的目标函数

这里采用各个误分类点与超平面的距离来定义。

图中（目前以输入为2维（x为x1和x2）情况下举例）w为超平面的法向量，与法向量夹角为锐角即为+1的分类，与法向量夹角为钝角为-1的分类

解释一下公式，首先，损失函数是是去判断误分类点到平面的距离的，但是这个正确的分类点的话， $y_i*(wx_i+b)$ 是大于零的（正确：y=1,wx+b>0；y=0,wx+b<0），但如果是错误分类的话， $y_i*(wx_i+b)$ 是小于零的，于是计算距离损失的时候需要增加一个负号 $-$ 。

3. 权重是如何更新的？

简单来说，就是用loss对你所要更新的权重做一阶导数，得到梯度，在这里我们要更新的权重（也就是我们模型所要学习的部分）是w和b，对它俩做一阶导数。

在这里插入图片描述
接下来就是更新w和b，利用学习率*一阶导数与目前的w和b进行相加。

而感知机并非用所有的误分类点，每一次去做更新，而是碰到一个误分类点就做一次更新，使用的梯度下降法实则是随机梯度下降法，所以更新的公式需要把累加去掉。
在这里插入图片描述

4. 整体过程

初始化w和b，其实就是初始一个超平面
随机选取一个点(x, y) ，如果满足y(wx+b)<0说明是误分类点（因为如果wx+b>0，y=+1，所以分类正确情况两者相乘>0, 反之），开始第3步
更新权重w和b
之后回到第2步继续训练，直到训练集中没有误分类点

在这里插入图片描述
如果还没有学习感知机的同学，移步到感知机哦
机器学习之感知机学习内容详解

1. 二者的区别（感知机和深度神经网络）

感知机
在这里插入图片描述

多个输入、一个输出
由于激活函数是sign函数，所以只能是二分类问题。

深度神经网络
在这里插入图片描述

多个输入、多个输出
不止用于分类问题，还可以用在回归、聚类等
加入隐藏层，隐藏层可以多个也可以一个（深度神经网络结构=输入层+有隐藏层+输出层）
隐藏层中的每一个神经元实则就是一个感知机,所以深度神经网络也被称为多层感知机
激活函数不再是sign，而是sigmoid，后面还出现tanh、relu或者softmax等激活函数.

Reference

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/176792.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

lua菜鸟教程_lua经典学习教程.pdf

上一篇 2026年3月26日下午9:02

hash冲突原理及解决方法

下一篇 2026年3月26日下午9:02

spring boot 过滤器_拦截器和过滤器的区别面试

spring boot 过滤器_拦截器和过滤器的区别面试原文地址：https://www.tsanyang.top/share-detail/739784336139616256.html最近实现一个权限控制功能，想通过拦截器进行实现，当业务一切按预期一样完成，有一个特别控制需要再拦截器对参数进行解析使用，但是发现当我们再拦截器读取了输入流，再控制器是无法获取到参数的，这个是由于输入流只能被读取一次，然后通过问题搜索了一把，看见网上通过重写HttpServletRequestWrapper实现输入流读取后，再写入回去，这样解决控制器无法获取参数问题，故在此做记

全栈程序员-站长
2022年8月23日
11
Pytest（14）pytest.ini配置文件

Pytest（14）pytest.ini配置文件前言pytest配置文件可以改变pytest的运行方式，它是一个固定的文件pytest.ini文件，读取配置信息，按指定的方式去运行查看pytest.ini的配置选项pytest-h找到以下

全栈程序员-站长
2022年7月30日
12
请说下封装 vue 组件的过程?_vue 自己封装过哪些通用组件

请说下封装 vue 组件的过程?_vue 自己封装过哪些通用组件vue3封装组件发布到npm上

全栈程序员-站长
2026年2月22日
6
如何用决策树模型做数据分析报告_决策树实例

如何用决策树模型做数据分析报告_决策树实例什么是决策树？决策树模型本质是一颗由多个判断节点组成的树。在树的每个节点做参数判断，进而在树的最末枝(叶结点)能够对所关心变量的取值作出最佳判断。通常，一棵决策树包含一个根结点，若干内…

全栈程序员-站长
2022年8月30日
4
tensorflow estimator使用总结

tensorflow estimator使用总结最近在使用 estimator 做项目发现官网对这个 estimator 整体的讲解和使用过程中的细节讲的比较少结合我是用过程中的问题对 estimator 的使用步骤进行了总结如下代码见 github 求 star 1 estimator 主要需要 model fn input fn 以及 serving fn2 model fn 主要是是用来定义 model input

全栈程序员-站长
2025年8月14日
9
cursor

震惊！4 x 70$超值Cursor Pro最新激活！菜鸟到大神都在用的高效省钱神器！

震惊！4 x 70$超值Cursor Pro最新激活！菜鸟到大神都在用的高效省钱神器！

全栈程序员-站长
2026年3月16日
5

发表回复

关注全栈程序员社区公众号