PCA最小平方误差理论推导

PCA最小平方误差理论推导PCA求解其实是寻找最佳投影方向,即多个方向的标准正交基构成一个超平面。理论思想:在高维空间中,我们实际上是要找到一个d维超平面,使得数据点到这个超平面的距离平方和最小

大家好,又见面了,我是全栈君,今天给大家准备了Idea注册码。

PCA最小平方误差理论推导

PCA求解其实是寻找最佳投影方向,即多个方向的标准正交基构成一个超平面。

理论思想:在高维空间中,我们实际上是要找到一个d维超平面,使得数据点到这个超平面的距离平方和最小

假设\(x_k\)表示p维空间的k个点,\(z_k\)表示\(x_k\)在超平面D上的投影向量,\(W = {w_1,w_2,…,w_d}\)为D维空间的标准正交基,即PCA最小平方误差理论转换为如下优化问题$$z_k = \sum_{i=1}^d (w_i^T x_k)w_i—(1)$$

\[argmin \sum_{i=1}^k||x_k – z_k||_2^2 \]

\[s.t. w_i^Tw_j = p(当i==j时p=1,否则p=0) \]

注:\(w_i^Tx_k\)为x_k在w_i基向量的投影长度,\(w_i^Tx_kw_i\)为w_i基向量的坐标值

求解:

\(L = (x_k – z_k)^T(x_k-z_k)\)

\(L= x_k^Tx_k – x_k^Tz_k – z_k^Tx_k + z_k^Tz_k\)

由于向量内积性质\(x_k^Tz_k = z_k^Tx_k\)

\(L = x_k^Tx_k – 2x_k^Tz_k + z_k^Tz_k\)

将(1)带入得$$x_k^Tz_k = \sum_{i=1}dw_iTx_kx_k^Tw_i$$

\[z_k^Tz_k = \sum_{i=1}^d\sum_{j=1}^d(w_i^Tx_kw_i)^T(w_j^Tx_kw_j) \]

根据约束条件s.t.得$$z_k^Tz_k = \sum_{i=1}dw_iTx_k^Tx_kw_i$$

\[L =x_k^Tx_k – \sum_{i=1}^dw_i^Tx_kx_k^Tw_i \]

根据奇异值分解$$\sum_{i=1}dw_iTx_kx_k^Tw_i = tr(WTx_kTx_kW)$$

\[L =argmin\sum_{i=1}^kx_k^Tx_k – tr(W^Tx_k^Tx_kW) = argmin\sum_{i=1}^k- tr(W^Tx_k^Tx_kW) + C \]

等价于带约束得优化问题:$$argmaxtr(WTXXTW)$$

\[s.t. W^TW = I \]

最佳超平面W与最大方差法求解的最佳投影方向一致,即协方差矩阵的最大特征值所对应的特征向量,差别仅是协方差矩阵\(\xi\)的一个倍数

定理

\[argmin\phi(W,Z|X) = tr((X-W^TZ)^T(X-W^TZ)) = ||X-W^TZ||_F^2 \]

\[s.t.W^TW=I_q \]

注:X为(n,p),Z为(n,q),q < p,w为(p,q)

该定理表达的意思也就是平方差理论,将降维后的矩阵通过W^T投影回去,再与X计算最小平方差,值越小说明信息损失越少

\(\phi\)目标函数最小时,W为X的前q个特征向量矩阵且\(Z=W^TX\)

以上优化可以通过拉格朗日对偶问题求得,最终也会得到$$argmaxtr(WTXXTW)$$

\[s.t. W^TW = I \]

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/120024.html原文链接:https://javaforall.net

(0)
上一篇 2021年12月30日 上午8:00
下一篇 2021年12月30日 上午9:00


相关推荐

  • pycharm 字体设置_pycharm另存为文件

    pycharm 字体设置_pycharm另存为文件1.步骤为:File–>Settings–>Appearance&Behavior–>Appearance–>Theme中就可以选择喜欢的主题2.一般将文件的保存格式默认设置为UTF-8,就不会出现乱码啦!步骤为:File–>Settings–>Editor–>FileandCodeTemplates–>选择Pyth…

    2022年8月28日
    8
  • 豆包AI写作文技巧与范文创作教程

    豆包AI写作文技巧与范文创作教程

    2026年3月14日
    1
  • SSH加密代理「建议收藏」

    SSH加密代理「建议收藏」1.首先拷贝putty到系统目录下2.然后执行命令putty-D22bin@ipplinkusername@hostname-D127.0.0.1:80883.设置代理就ok了

    2025年10月17日
    5
  • JAVA bean的作用域

    JAVA bean的作用域1、Bean的5种作用域(1)singleton:单例模式,SpringIoC容器中只会存在一个共享的Bean实例,无论有多少个Bean引用它,始终指向同一对象Singleton作用域是Spring中的缺省作用域,也可以显示的将Bean定义为singleton模式,配置为:<beanid=”userDao”class=”com.ioc.UserDaoImpl”scope=”singleton”/>(2)prototype:原型模式,每次通过Spring容器获取prototype定

    2025年7月3日
    3
  • mac Big Sur系统 mvn打包报错:No compiler is provided in this environment. Perhaps you are running on a JRE

    mac Big Sur系统 mvn打包报错:No compiler is provided in this environment. Perhaps you are running on a JRE一 背景最近将 mac 升级到 BigSur 版本 出现了个别奇奇怪怪的小问题 系统升级后执行 mvn 命令 总是出现以下错误 Nocompileris Perhapsyouar 截图如下 网上搜索了很多答案 基本都是说环境变量的问题 通过 java version 检查了环境变量没啥问题 折腾老半天没搞定 最终找到了解决方案 在这里将这个坑分享出来 二 解决办法 2 1 下载并安装

    2026年3月17日
    2
  • CSS绝对定位

    CSS绝对定位当元素的 position 设置为 absolute 时 则开启了元素的绝对定位用法 position absolute 绝对定位的特点 与相对定位一样 开启了绝对定位以后 如果不设置偏移量 元素的位置不会发生任何改变开启绝对定位之后 元素会从原有的文档流中脱离 只是相对于它的包含块定位 包含块可能是文档流中的另一个元素或者是初始包含块绝对定位会改变元素的性质 行内元素变为块元素 块元素的宽度被内容撑开 即块元素中原有内容有多宽 开启绝对定位之后的块元素就有多宽 绝对定位会使元素提升一个层级下面我们来看一个栗子

    2026年3月20日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号