（系列笔记）13.SVR模型

SVR——一种“宽容的回归模型”

严格的线性回归

线性回归：在向量空间里用线性函数去拟合样本。该模型以所有样本实际位置到该线性函数的综合距离为损失，通过最小化损失来求取线性函数的参数。对于线性回归而言，一个样本只要不算正好落在作为模型的线性函数上，就要被计算损失。

宽容的支持向量回归（SVR）

介绍一种“宽容的”回归模型：支持向量回归(Support Vector Regression，SVR)

模型函数

支持向量回归模型的模型函数也是一个线性函数： $y = w x + b$ ，但是和线性回归是两个不同的回归模型！
不同点在于：计算损失的原则不同，目标函数和最优化算法也不同。

原理

SVR的两个松弛变量

有一点和SVM是正好相反的：SVR希望样本点都落在“隔离带”内，而SVM希望样本点都在“隔离带”外。这导致SVR要同时引入两个松弛变量： $\xi$ 和 $\xi^*$

上图显示了SVR的基本情况：

$f (x) = w x + b$ 是我们最终要求得的模型函数；
$wx+b+\epsilon$ $wx+b-\epsilon$ （也就是 $f(x)+\epsilon$ 和 $f(x)-\epsilon$ ）是隔离带的上下边缘；
$\xi^*$ 是隔离带下边缘之下样本点，到隔离带下边缘上的投影，与该样本点 $y$ 值的差。

SVR的主问题和对偶问题

SVR主问题的数学描述

在这里插入图片描述

SVR的拉格朗日函数和对偶问题

求解SVR对偶问题

用SMO算法求解SVR

使用SMO算法前，还需将 $\alpha_i$ 和 $\alpha_i^*$ 转化为一个参数，因为SMO算法针对的是任意样本 $x_i$ 只对应一个参数 $\alpha_i$ 的情况。

过程采用拉格朗日对偶法，对偶问题有解的充要条件是满足KKT条件，对于SVR的对偶问题，其KKT条件如下：
在这里插入图片描述
由KKT条件可见，当且仅当 $f(x_i)-y_i-\epsilon-\xi_i=0$ 时， $\alpha_i$ 才可以取非0值，当且仅当
$y_i-f(x_i)-\epsilon-\xi_i^*=0$ ， $\alpha_i^*$ 才可以取非0值。

$f(x_i)-y_i-\epsilon-\xi_i=0=>y_i=f(x_i)-\epsilon-\xi_i$ 对应的是在隔离带下边缘以下的样本；
$y_i-f(x_i)-\epsilon-\xi_i^*=0=>y_i=f(x_i)+\epsilon+\xi_i^*$ 对应的是在隔离带上边缘以上的样本。

一个样本不可能同时在上边缘上和上边缘下，所以这两个等式只有体格而成立，所以相应的 $\alpha_i$ 和 $\alpha_i^*$ 中至少有一个为0。

假设： $\lambda_i=\alpha_i-\alpha_i^*$
既然 $\alpha_i$ 和 $\alpha_i^*$ 中至少有一个为0，且 $0<=\alpha_i,\alpha_i^*,<=C$ ，于是： $|\lambda_i|=\alpha_i+\alpha_i^*$
将 $\lambda_i$ 和 $|\lambda_i|$ 代入对偶问题，则有：
在这里插入图片描述
如此一来，即可以用SMO求解了（这个推导过程仅仅用于说明SMO也可以应用于SVR，具体的求解过程和SVM的SMO算法还是有所差异的）

支持向量与求解线性模型参数

因为 $f (x) = w x + b$ ，以及前面求出的 $w=\sum_{i=1}^{m}{(\alpha_i^*-\alpha_i)x_i}$ ，因此：

由此可见，只有满足 $\alpha_i^*-\alpha_i=\not 0$ 的样本才对 $w$ 取值有意义，才是SVR的支持向量。也就上，当样本满足下列条件之一时，才是支持向量：
在这里插入图片描述
换言之，这个样本要么在隔离带上边缘以上，要么在隔离带下边缘以下（含两个边缘本身），也就是说，落在 $\epsilon-$ 隔离带之外的样本，才是SVR的支持向量。
可见，无论是SVM还是SVR，它们的解都仅限于支持向量，即只是全部训练样本的一部分，因此SVM和SVR的解都具有稀疏性。

通过最优化方法求解出了 $w$ 之后，我们还需要求b。
$f(x_i)=wx_i+b=>b=f(x_i)-wx_i$ ，而且对于那些落在隔离带边缘上的支持向量，有 $f(x_i)=y_i+\epsilon$ ，落在隔离带下边缘上的支持变量有 $f(x_i)=y_i-\epsilon$ 。因此，
在这里插入图片描述
其中 $S_u$ 是位于隔离带上边缘的支持向量集合，而 $S_d$ 则是位于隔离带下边缘的支持向量集合。

SVR的核技巧

前面讲过的适用于SVM的核技巧也同样适用于SVR。SVR 核技巧的实施办法和 SVM 一样，也是将输入空间的 $x$ 通过映射函数 $\phi(x)$ 映射到更高维度的特征空间，然后再在特征空间内做本文前述的一系列操作。

因此，在特征空间中的线性模型为： $f(x)=w\phi(x)+b$
其中：

对照SVM核函数的做法，我们也令：
在这里插入图片描述
具体核技巧的实施过程，对照SVM即可。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/218342.html原文链接：https://javaforall.net

（系列笔记）13.SVR模型

SVR——一种“宽容的回归模型”

严格的线性回归

宽容的支持向量回归（SVR）

模型函数

原理

SVR的两个松弛变量

SVR的主问题和对偶问题

SVR主问题的数学描述

SVR的拉格朗日函数和对偶问题

求解SVR对偶问题

用SMO算法求解SVR

支持向量与求解线性模型参数

SVR的核技巧

关于作者

全栈程序员-站长

发表回复

（系列笔记）13.SVR模型

SVR——一种“宽容的回归模型”

严格的线性回归

宽容的支持向量回归（SVR）

模型函数

原理

SVR的两个松弛变量

SVR的主问题和对偶问题

SVR主问题的数学描述

SVR的拉格朗日函数和对偶问题

求解SVR对偶问题

用SMO算法求解SVR

支持向量与求解线性模型参数

SVR的核技巧

关于作者

全栈程序员-站长

相关推荐

科大讯飞发布星火X1.5，率先在全国产算力平台攻克MoE模型全链路训练效率

Agent知识图谱怎么做？6步轻松实现AI智能推理能力

mos管的基本开关电路_mos管控制交流开关电路

浙文互联AI营销／数字人／AIGC与腾讯元宝（混元大模型底座、微信生态、效率工具

GPT-5免费指南，手把手教你使用OpenAI最强模型

对于RFID-RC522 模块的读写操作【Arduino】[通俗易懂]

发表回复