证明：SST=SSE+SSR

全栈程序员-站长 • 2026年3月18日上午10:58 • 未分类 • 阅读 2

文章目录

简介
重要关系：SST=SSE+SSR
证明
结论
参考资料

简介

在线性回归计算(Linear Regression) 中，有三个非常重要的概念：

总离差平方和（Sum of Squares Total）
$SST=\sum_{i=1}^n (y_i-\bar y)^2$
残差平方和（Sum of Squared Errors）
$SSE=\sum_{i=1}^n (y_i-\hat y_i)^2$
回归平方和（Sum of Squares Regression ）
$SSR=\sum_{i=1}^n (\hat y_i-\bar y)^2$

重要关系：SST=SSE+SSR

这个结论很重要，表明了三者的关系，同时也简化了计算。但是结论似乎很奇怪，因为根据常识，当 $a + b = c$ 成立的时候， $a^2 + b^2 = c^2$ 是不能保证一定成立的。我们将上面的等式展开，化简后可以得到以下等式：
$\sum \left(\hat{y_i} – \bar{y_i} \right) \left( y_i – \hat{y_i} \right) = 0$
所以，我们只要证明这个等式成立，即可证明 $S S T = S S E + S S R$ ，然而发现这个等式还真不好证明，在查阅了大量资料后，总算完成了证明，过程如下所示。

证明

最小二乘回归的基本原理是将误差的平方和最小化。实际上公式中所要求的就是 $e_i=y_i – \hat{y_i}$ ，我们可以使用微积分找到参数 $\beta_0$ 和 $\beta_1$ 的方程式，以使 $\sum_0^n e_i^2$ 的值最小。（注：为书写和显示方便直观，在证明过程中省略求和的上下限。)

设 $\hat{y_i} = \beta_0 + \beta_1x_i$ ，则：
$\displaystyle\sum\limits_{i=1}^n e_i^2 = \sum \left(y_i – \hat{y_i} \right)^2= \sum \left(y_i – \beta_0 – \beta_1x_i\right)^2$

我们的目的就是找到 $\beta_0$ 和 $\beta_1$ 使总和 $S$ 最小的值。根据高等数据的基本原理，一个函数取得最值的点的导数为0。由此可得， $S$ 求相对于 $\beta_0$ 的偏导数为零，即：

$\frac{\partial{S}}{\partial{\beta_0}} = \sum 2\left(y_i – \beta_0 – \beta_1x_i\right)^1(-1) = 0$

然后，再重新排列并求解 $\beta_0$ ，
$\sum \beta_0 = \sum y_i -\beta_1 \sum x_i$

$n\beta_0 = \sum y_i -\beta_1 \sum x_i$

$\beta_0 = \frac{1}{n}\sum y_i -\beta_1 \frac{1}{n}\sum x_i$

在求完 $\beta_0$ 的偏导数以后，我们再求 $S$ 相对 $\beta_1$ 的偏导数，同理有：
$\frac{\partial{S}}{\partial{\beta_1}} = \sum 2\left(y_i – \beta_0 – \beta_1x_i\right)^1 (-x_i) = 0$

等式两边同时除以 $- 2$ 再重新排列，可得：

$\sum x_i \left(y_i – \beta_0 – \beta_1x_i\right) = 0$

又因为 $\hat{y_i} = \beta_0 + \beta_1x_i$ ，所以
$x_i = \frac{1}{\beta_1}\left( \hat{y_i} – \beta_0 \right) = \frac{1}{\beta_1}\hat{y_i} -\frac{\beta_0}{\beta_1}$

$\sum \left(\frac{1}{\beta_1}\hat{y_i} – \frac{\beta_0}{\beta_1}\right) \left(y_i – \hat{y_i} \right) = 0$

$\frac{1}{\beta_1}\sum \hat{y_i} \left(y_i – \hat{y_i} \right) – \frac{\beta_0}{\beta_1} \sum \left(y_i – \hat{y_i} \right)= 0$

现在，第二项为零（由 $e q n . 1$ 表示），因此，我们立即得到所需的结果：
$\tag{Eq. 2}\sum \hat{y_i} \left(y_i – \hat{y_i} \right) = 0 \uad$

最终，根据 $\bar y * Eq.1$ 可得
$\sum \hat{y_i} \left(y_i – \hat{y_i} \right) – \bar y \sum \left(y_i – \hat{y_i} \right) = 0$

结论

通过以上证明过程，我们证明了 $S S T = S S E + S S R$ 。但是正如前言所说，当 $a + b = c$ 成立的时候， $a^2 + b^2 = c^2$ 是不能保证一定成立的，这里的等式之所以成立，是因为有个重要的前提就是拟合值最小，所以我们才可以用 $\frac{\partial{S}}{\partial{\beta_0}} = 0$ 和 $\frac{\partial{S}}{\partial{\beta_1}} =0$ 两式联立进行求解。如果没有这个条件，即拟合过程中没有取得最值，这个结论是不能保证成立的。

参考资料

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/216825.html原文链接：https://javaforall.net

证明：SST=SSE+SSR

文章目录

简介

重要关系：SST=SSE+SSR

证明

结论

参考资料

关于作者

全栈程序员-站长

发表回复

证明：SST=SSE+SSR

文章目录

简介

重要关系：SST=SSE+SSR

证明

结论

参考资料

关于作者

全栈程序员-站长

相关推荐

Linclaw、QClaw、ArkClaw对比：AI Agent本地部署实战

Grok 4.1大模型正式发布：强化学习优化情感智能与创意能力，幻觉率显著降低至4.22%

c语言生成随机数数组

学生个人网页制作html_个人网页简单模板

【Oracle】LISTAGG 函数的使用

pycharm设置缩进_首行缩进快捷键是什么

发表回复