核PCA投影平面公式推导

样本方差推导样本方差公式$$S=\frac{1}{n1}\sum_{i=1}^n(x_i\mu_i)^2$$扩展开来得到$$S=\frac{1}{n1}[(X\frac{1}{n}

大家好,又见面了,我是全栈君,今天给大家准备了Idea注册码。

样本方差推导

样本方差公式$$S = \frac{1}{n-1}\sum_{i=1}n(x_i-\mu_i)2$$

扩展开来得到$$S = \frac{1}{n-1}[(X-\frac{1}{n}XTI_nI_nT)T(X-\frac{1}{n}XTI_nI_n^T)]$$

\[S = \frac{1}{n-1}X^T(I_n – \frac{1}{n}I_nI_n^T)(I_n – \frac{1}{n}I_nI_n^T)X \]

\(H = I_n – \frac{1}{n}I_nI_n^T\)得$$S = \frac{1}{n-1}X^THX$$

其中H为等幂矩阵HH=H和中心矩阵\(H_n*I_n = 0\)

核PCA推导

核函数:设X是输入空间(\(R^n\)的子集或离散子集),又F为特征空间(希尔伯特空间),如果存在一个从X到F的隐射$$\phi (X):X -> F$$使得对所有x,z\in X,函数K(x,z)满足条件$$K(x,z) = \phi (x)\bullet \phi (z)$$

下面推导F投影到的主成分定义的平面,根据F样本方差的特征值分解得(为推导方便去掉前面的(\(\frac{1}{n-1}\))$$F^THFV_i = \lambda _i V_i$$由于H为等逆矩阵,则$$F^THHFV_i = \lambda _i V_i$$

由于想得到F很难,我们换一种思路将求F转移求K上,根据AAT与ATA的关系:非零特质值相同,得到$$HFF^THU_i = \lambda _iU_i $$

两边同时乘以\(F^TH\)得到$$FTHHFFTHU_i = \lambda _iF^THU_i$$

从上式可以得到\(F^THU_i\)\(F^THHF\)的特征向量

\(F^THU_i\)进行归一化$$U_{normal} = \frac{FTHU_i}{{||U_iTHFF^THU_i||}_2}$$

由于\(HFF^TH = HKH = \lambda _i\),则$$U_{normal} = \lambda {-\frac{1}{2}}FTHU_i$$

F投影到\(U_normal\)定义的平面$$P = F_{center} U_{normal}$$

\[P= (F-\frac{1}{n}\sum_{i=1}^nF_i)(\lambda ^{-\frac{1}{2}}F^THU_i) \]

\[P= (F-\frac{1}{n}F^TI_n)(\lambda ^{-\frac{1}{2}}F^THU_i) \]

\[P= \lambda ^{-\frac{1}{2}}(K – \frac{1}{n}K(x,x_i))HU_i \]

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/120025.html原文链接:https://javaforall.net

(0)
上一篇 2021年12月30日 上午9:00
下一篇 2021年12月30日 上午9:00


相关推荐

  • 2004(馬拉)微軟科技教育大會嘅卡拉囌

    2004(馬拉)微軟科技教育大會嘅卡拉囌

    科技 2021年7月21日
    74
  • c语言子程序return,c语言return返回到哪

    c语言子程序return,c语言return返回到哪c 语言 return 返回到哪 c 语言 return 返回给了上一级 比如一个递归程序 从第三层返回到第二层 又比如一个普通的子程序 那就返回到主程序中去 主程序中 return 返回给了操作系统 比如下面一个 c 程序 intsum inta intb returna b intmain intargc charconst argv intc sum 1000 24

    2026年3月17日
    2
  • Python 连接数据库两种方式

    Python 连接数据库两种方式Python连接数据库两种方式

    2025年5月30日
    5
  • 如何设置线程池参数大小?

    如何设置线程池参数大小?关注Java后端技术栈“回复“面试”获取最新资料我们在使用线程池的时候,会有两个疑问点:线程池的线程数量设置过多会导致线程竞争激烈如果线程数量设置过少的话,还会导致系统无法充分利用计算机…

    2022年5月20日
    62
  • 2000数据库置疑怎么处理_msdb数据库置疑的解决方法

    2000数据库置疑怎么处理_msdb数据库置疑的解决方法由于服务器意外的断电,导致SQLSERVER服务器上数据库出现“置疑”而无法使用,通过网上搜索,找到以下方法解决问题,这里记录一下:产生数据库置疑的时侯,数据库文件和日志文件都是存在的,如果数据库文件都不存在了,则要另当处理。1、停止数据库服务器,将数据库MDF文件和LDF文件复制备份一份2、启动数据库服务器,删除置疑的数据库3、仅用备份的数据库MDF文件附加数据库,sp_attach_…

    2022年8月20日
    14
  • 磁道 扇区 图解

    磁道 扇区 图解在下图中 我们可以看到一圈圈被分成 18 假设 等分的同心圆 这些同心圆就是磁道 见图 不过真打开硬盘你可看不到 它实际上是被磁头磁化的同心圆 如图可以说是被放大了的磁盘片 那么扇区就是每一个磁道中被分成若干等分的区域 相邻磁道是有间隔的 这是因为磁化单元太近会产生干扰 一个小软盘有 80 个磁道 硬盘嘛要远远大于此值 有成千上万的磁道 每个柱面包括 512 个字节 那么什么是柱面呢 看下图

    2026年3月18日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号