深入理解协方差(图文详解)

深入理解协方差(图文详解)先从方差开始 我们有一组样本 x1 x2 x3 xn 这组样本的均值为 EX 每一个样本都与 EX 之间存在误差 那么这组样本的方差被定义为 所有误差的和的均值 也即 xi EX 2 n 1 方差的作用就是用来 衡量样本偏离均值的程度 下面开始看协方差 仔细观察上述定义式 可知 如果两个变量的变化趋势一致 也就是说如果其中一个大于自身的期望值时另外一个也大于自身的

先从方差开始,我们有一组样本x1、x2、x3····xn,这组样本的均值为EX,每一个样本都与EX之间存在误差,那么这组样本的方差被定义为:所有误差的和的均值,也即[Σ(xi-EX)^2]/(n-1),

方差的作用就是用来“衡量样本偏离均值的程度”。

下面开始看协方差:

深入理解协方差(图文详解)

 

仔细观察上述定义式,可知:如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

下面再从直观上理解一下上面这段话,假设我们拿到了一组(X, Y)的样本如下图(a)所示。然后让这组样本中的X、Y各自减掉自己的期望,得到新的一组样本,显然这组新样本的均值就变成了(0,0),这组新样本会分布在原点周围,如下图(b)所示。如果我们再把图b中的样本的每一个点的X乘以Y得到积,把积画在图(c)中,那么图b的二维样本就会退化为一系列一维的点,而且,下图b的一三象限的点的积会分布到下图c的正半轴,二四象限的点会分布到负半轴,,根据上面的定义式,图c中样本的均值,就是图1中XY的协方差,从直观上看它的均值接近于0,物理意义就是,X和Y是几乎完全不相关。

深入理解协方差(图文详解)  图a              深入理解协方差(图文详解)图b          深入理解协方差(图文详解)图c

注意:上面的协方差定义中,EX和EY是数学期望,是个精确的理论值,而不是样本均值(样本数目无穷多时,样本均值会无穷接近于数学期望,这是大数定律之一,证明过程大学都学过的,可惜忘干净了),但是X、Y在没有理论概率分布表达式的情景中,我们只能用n个样本的和除以n来代替数学期望。

下面我们再来看一个X和Y正相关的例子,也即在某次我们同时对xy采样时,当x的采样值>x的均值时,y的样本也一般是>y的均值。

深入理解协方差(图文详解)图a深入理解协方差(图文详解)图b深入理解协方差(图文详解)图c

XY的采样值如上图a所示,各自减掉自己的均值后,得到的新样本如图b所示,图b中的样本中的每个点把x*y,得到一维样本如图c所示,显然,由图b转换为图c的时候,只有图b中第二象限的两个点落到了图c的负半轴,图b的其余点都落到了图c的正半轴,图c中样本的均值显然是个正值,这个正值就是图a的样本的协方差。

图c的均值很大,也就是说图a的样本的协方差很大,那么分析一下图c的均值大的原因,那是因为图b中的点x*y的积大,为什么积这么大,因为图a的X、Y的样本偏离各自的均值EX、EY太大了。换句话说,如何才能使得图c中的样本均值变小呢,也即如何才能使图a的样本的协方差变小呢?显然有两个办法:(1)让图c中的每一个点的数值变小,也即让图b中的点都靠近原点,也即让图a的点都靠近X、Y各自的均值;(2)增加图c中负半轴的点的数量,也即增加图b中二四象限中的点的数量,也即让图a的点在反对角线上也出现一些。这两种方法也就指出了,协方差小的原因:一是X、Y各自的方差要小,二是X、Y相关性要若。

 

根据以上两组图形,以及分析,我们得知:

两个因素会影响协方差的值:

1、两个变量各自的方差不变的情况下,两个变量的正相关性越强烈,协方差越大,负相关性越强烈,协方差越小;

2、两个变量的相关性不变的情况下,x或y变量的方差越大,协方差的绝对值越大。(“或”的意思是,x的方差大,或者y的大,或者它俩的都大);

因素1对协方差的影响是“绝对”大小(带符号),因素2影响的是“绝对值”的大小

 

 

反过来的推论: 如果协方差的值是个很大的正数,我们可以得到两个结论:

(1) 两者有很大概率是正相关的;

(2) 这个值很大到底是因为①:正相关很强烈造成的呢?还是②:x或y的方差很大造成的呢,这个①和②我们是区分不出来的

为什么剔除信息的方法是除以标准差呢?其实从协方差的定义式就能看出端倪,E[(X-EX)(Y-EY)],显然协方差的绝对值变大的根本原因就是每一个(X-EX)(Y-EY)变大

深入理解协方差(图文详解)

 

上面讲的是两个变量之间的协方差,如果有n个变量X1、X2、···Xn,两两之间的协方差,就可以组成协方差矩阵,我们定义:

深入理解协方差(图文详解)

那么上述n个变量的协方差矩阵就是:

深入理解协方差(图文详解),其中,深入理解协方差(图文详解)

 

如果有:

深入理解协方差(图文详解)

那么Y的协方差矩阵为:

深入理解协方差(图文详解)

其中,深入理解协方差(图文详解)

再利用深入理解协方差(图文详解),可以容易证明深入理解协方差(图文详解),这个式子就是卡尔曼滤波的第二个公式。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/216668.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 上午11:20
下一篇 2026年3月18日 上午11:21


相关推荐

  • 太顶了!全网最全的600+图片生成玩法!

    太顶了!全网最全的600+图片生成玩法!

    2026年3月15日
    3
  • Python框架对比:Flask与Django

    Python框架对比:Flask与DjangoFlask 框架和 Django 框架的区别是什么 Flask 自由 灵活 可扩展性强 第三方库的选择面广 开发时可以结合自己最喜欢用的轮子 也能结合最流行最强大的 Python 库 Django 太重了 除了 Web 框架 自带 ORM 和模板引擎 灵活和 Django 能开发小应用 但总会有 杀鸡焉用牛刀 的感觉 Flask 框架和 Django 框架区如下 一 Flask 框架 Flask 确实很 轻 不愧是 MicroFramewo 从 Django 转向 Flask 的开发者一定会如此感慨 除非二者均为深入使用过 Flask 自由

    2026年3月18日
    2
  • JavaFX横幅类游戏开发 教训 游戏贴图

    JavaFX横幅类游戏开发 教训 游戏贴图

    2022年1月3日
    49
  • ubuntu关闭防火墙

    ubuntu关闭防火墙sudoufwstatu 中其他常用的防火墙命令 ufwdefaultal deny 外来访问默认允许 拒绝 ufwallow deny20 允许 拒绝访问 20 端口 20 后可跟 tcp 或 udp 表示 tcp 或 udp 封包 ufwallow denyservicen ufw 从 etc services 中找到对应 service 的端口 进行过滤 ufwallowprot

    2026年3月26日
    2
  • html css制作404页面,一款纯css3实现的漂亮的404页面

    html css制作404页面,一款纯css3实现的漂亮的404页面实现的代码。html代码:404ERRORLost?MaybeIcanhelp.required/>SearchMySuggestions.HomePortfoliocss3代码:body{background-color:#0A7189;color:#fff;font:100%”Lato”,sans-serif;font-size:1.8r…

    2022年7月27日
    14
  • ubuntu16.04安装opencv3.4.1教程

    ubuntu16.04安装opencv3.4.1教程最近 opencv3 4 1 发布了 想换个新的试试鲜 于是把配置的过程通过博文的方式记录下来 方便查阅 本教程原为 3 3 0 但经过博主亲测 3 4 0 3 4 1 皆适用 1 去官网下载 opencv 在本教程中选用的时 opencv3 4 1 其他版本的配置方法异曲同工 下载链接 http opencv org releases html 选择 sources 版本 2 解压下

    2026年3月19日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号