讲道理 | 特征值和特征向量意义

讲道理 | 特征值和特征向量意义原文转自 https blog csdn net fuming article details 在刚开始学的特征值和特征向量的时候只是知道了定义和式子 并没有理解其内在的含义和应用 这段时间整理了相关的内容 跟大家分享一下 首先我们先把特征值和特征向量的定义复习一下 定义 设 A 是 n 阶矩阵 如果数 和 n 维非零向量 x 使关系式 1

原文转自 https://blog.csdn.net/fuming/article/details/

 

在刚开始学的特征值和特征向量的时候只是知道了定义和式子,并没有理解其内在的含义和应用,这段时间整理了相关的内容,跟大家分享一下;

首先我们先把特征值和特征向量的定义复习一下:

定义: 设A是n阶矩阵,如果数λ和n维非零向量x使关系式

讲道理 | 特征值和特征向量意义……(1)

成立,那么,这样的数λ称为矩阵A的特征值,非零向量x称为A的对应于特征值λ的特征向量,(1)式还可以写为:

               讲道理 | 特征值和特征向量意义……(2)

如果想求出矩阵对应的特征值和特征向量就是求式(2)的解了。

那么,问题来了,这个式子要怎么理解呢?

首先得先弄清矩阵的概念:一个矩阵代表的是一个线性变换规则,而一个矩阵的乘法运行代表的是一个变换;

比如有一个矩阵A:

讲道理 | 特征值和特征向量意义

一个列向量为X为:

讲道理 | 特征值和特征向量意义

一个矩阵的乘法为:

讲道理 | 特征值和特征向量意义

向量X通过矩阵A这个变化规则就可以变换为向量Y了

                      讲道理 | 特征值和特征向量意义

在几何上的变换就类似于这样:

               讲道理 | 特征值和特征向量意义

       知道了这个就可以从几何上理解特征值和特征向量是什么意思了,由  

               讲道理 | 特征值和特征向量意义

可知:

讲道理 | 特征值和特征向量意义

所以,确定了特征值之后,向量x的变换为:                         

讲道理 | 特征值和特征向量意义

引用《线性代数的几何意义》的描述:“矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。”

那么这样定义的特征值和特征向量有什么实际用途呢?在这里我举个数据挖掘算法中重要的一个算法:PCA(主成分分析)来给大家直观的感受一下。

首先,理解一下信息量这个概念

看几张图:

                     讲道理 | 特征值和特征向量意义

如果我们单独看某一个维度的话,比如看x1这个维度

                      讲道理 | 特征值和特征向量意义

 

可以看到将点投影到x1这个维度上看的话,图1的数据离散性最高,图3较低,图2数据离散性是最低的。数据离散性越大,代表数据在所投影的维度上具有越高的区分度,这个区分度就是信息量。如果我们用方差来形容数据的离散性的话,就是数据方差越大,表示数据的区分度越高,也就是蕴含的信息量是越大的。

         基于这个知识,如果我们想对数据进行降维的话,比如图1的两个维度的数据降成一维,我们可以选择保留X1这个维度的数据,因为在这个维度上蕴含的信息量更多。

同理,图2就可以保留x2这个维度的数据。但是,问题来了,图3应该保留哪个维度的数据呢?答案是保留哪个维度都不好,都会丢失较大的信息量。但是,如果我们把图3的坐标轴旋转一下

            讲道理 | 特征值和特征向量意义
   比较容易看出,图3在新的坐标轴下就能进行降维了。所以选取正确的坐标轴,然后根据各个维度上的数据方差大小,决定保留哪些维度的数据,这样的做法就是主成分分析的核心思想。

选取正确的坐标轴的过程中,我们需要一个矩阵变换,就类似于这样:   

                                           讲道理 | 特征值和特征向量意义

也就是:

讲道理 | 特征值和特征向量意义

其实,经过数学上的推导的,我们就可以知道,特征值对应的特征向量就是理想中想取得正确的坐标轴,而特征值就等于数据在旋转之后的坐标上对应维度上的方差。

也就是说,直接求出矩阵A的特征向量得出对应的特征向量。我们就能找到旋转后正确的坐标轴。这个就是特征值和特征向量的一个实际应用:“得出使数据在各个维度区分度达到最大的坐标轴。”

所以,在数据挖掘中,就会直接用特征值来描述对应特征向量方向上包含的信息量,而某一特征值除以所有特征值的和的值就为:该特征向量的方差贡献率(方差贡献率代表了该维度下蕴含的信息量的比例)。

通常经过特征向量变换下的数据被称为变量的主成分,当前m个主成分累计的方差贡献率达到一个较高的百分数(如85%以上)的话,就保留着这m个主成分的数据。实现了对数据进行降维的目的。整个主成分分析的算法原理也就是这个。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/209679.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 上午8:40
下一篇 2026年3月19日 上午8:40


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号