【模式识别】感知器 Perceptron

全栈程序员-站长 • 2026年3月17日下午7:32 • 未分类 • 阅读 2

基本概念

线性可分：在特征空间中可以用一个线性分界面正确无误地分开两类样本；采用增广样本向量，即存在合适的增广权向量 a 使得：

【模式识别】感知器 Perceptron

则称样本是线性可分的。如下图中左图线性可分，右图不可分。所有满足条件的权向量称为解向量。权值空间中所有解向量组成的区域称为解区。

【模式识别】感知器 Perceptron

通常对解区限制：引入余量b，要求解向量满足：

【模式识别】感知器 Perceptron

使解更可靠（推广性更强），防止优化算法收敛到解区的边界。

感知准则函数及求解

对于权向量a，如果某个样本yk被错误分类，则【模式识别】感知器 Perceptron 。我们可以用对所有错分样本的求和来表示对错分样本的惩罚：

【模式识别】感知器 Perceptron

其中Yk是被a错分的样本集合。当且仅当JP(a*) = min JP(a) = 0 时，a*是解向量。这就是Rosenblatt提出的感知器（Perceptron）准则函数。

感知器准则函数的最小化可以使用梯度下降迭代算法求解：

【模式识别】感知器 Perceptron

其中，k为迭代次数，η为调整的步长。即下一次迭代的权向量是把当前时刻的权向量向目标函数的负梯度方向调整一个修正量。

【模式识别】感知器 Perceptron

因此，迭代修正的公式为：

【模式识别】感知器 Perceptron

即在每一步迭代时把错分的样本按照某个系数叠加到权向量上。

通常情况，一次将所有错误样本进行修正不是效率最高的做法，更常用是每次只修正一个样本或一批样本的固定增量法：

【模式识别】感知器 Perceptron

收敛性讨论：可以证明，对于线性可分的样本集，采用这种梯度下降的迭代算法：

【模式识别】感知器 Perceptron

经过有限次修正后一定会收敛到一个解向量。

理论结论：只要训练样本集是线性可分的，对于任意的初值 a(1) ，经过有限次叠代，算法必定收敛。

感知器是最简单可以“学习”的机器，可以解决线性可分的问题。当样本线性不可分时，感知器算法不会收敛。实际应用中直接使用感知器的场合并不多，但他是很多复杂算法的基础。

（转载请注明作者和出处：http://blog.csdn.net/xiaowei_cqu 未经允许请勿用于商业用途）

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/220834.html原文链接：https://javaforall.net

【模式识别】感知器 Perceptron

基本概念

感知准则函数及求解

（转载请注明作者和出处：http://blog.csdn.net/xiaowei_cqu 未经允许请勿用于商业用途）

关于作者

全栈程序员-站长

发表回复

【模式识别】感知器 Perceptron

基本概念

感知准则函数及求解

（转载请注明作者和出处：http://blog.csdn.net/xiaowei_cqu 未经允许请勿用于商业用途）

关于作者

全栈程序员-站长

相关推荐

SVM原理介绍

文件系统的类型简介「建议收藏」

DeepSeek+开源n8n：24h推特(X)热点监控Workflow太绝了！【附赠：完整工作流文件】

【小白视角】大数据基础实践(五) MapReduce编程基础操作

python decode函数的用法_decode函数的用法

python2 nonlocal_Python nonlocal

发表回复