一、数据降维
,即由原来的二维转换成了一维。处理降维的技术有很多种,如前面的SVD奇异值分解,主成分分析(PCA),因子分析(FA),独立成分分析(ICA)等等。
二、PCA的概念
维特征映射到
维上,这
维是全新的正交特征。这
维特征称为主元,是重新构造出来的
维特征。在PCA中,数据从原来的坐标系转换到新的坐标系下,新的坐标系的选择与数据本身是密切相关的。其中,第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴选取的是与第一个坐标轴正交且具有最大方差的方向,依次类推,我们可以取到这样的
个坐标轴。
三、PCA的操作过程
1、PCA的操作流程大致如下:

- 取平均值
我们计算每一维特征的平均值,并去除平均值,我们计算出均值
为



- 计算
的协方差矩阵
- 计算
的特征值与特征向量
其中,特征值为


- 对特征值进行排序,显然就两个特征值
- 选择最大的那个特征值对应的特征向量

- 转换到新的空间

四、实验的仿真

PCA函数段
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/225006.html原文链接:https://javaforall.net
