详解马氏距离中的协方差矩阵计算(超详细)

详解马氏距离中的协方差矩阵计算(超详细)一、概率统计基本知识1.样本均值样本均值(Mean)是在总体中的样本数据的平均值。2.样本方差方差(Variance)是度量一组数据的离散(波动)程度。方差是各个样本与样本均值的差的平方和的均值,分母除以n-1是为了满足无偏估计:3.样本标准差4.协方差协方差(Covariance)是度量两个变量的变动的同步程度,也就是度量两个变量线性相关性程度。若协方差大于0,表示一个变量增大时另一个变量也会增大,即两个变量呈正相关;若协方差小于0,表示一个变量增大时另一个变量会减小,即两个变量呈负相关

大家好,又见面了,我是你们的朋友全栈君。

一、概率统计基本知识

1.样本均值
样本均值(Mean)是在总体中的样本数据的平均值。
在这里插入图片描述
2.样本方差
方差(Variance)是度量一组数据的离散(波动)程度。方差是各个样本与样本均值的差的平方和的均值,分母除以n-1是为了满足无偏估计:
在这里插入图片描述
3.样本标准差
在这里插入图片描述4.协方差
协方差(Covariance)是度量两个变量的变动的同步程度,也就是度量两个变量线性相关性程度。若协方差大于0,表示一个变量增大时另一个变量也会增大,即两个变量呈正相关;若协方差小于0,表示一个变量增大时另一个变量会减小,即两个变量呈负相关;若协方差为0,则统计学上认为二者线性无关。注意两个无关的变量并非完全独立,只是没有线性相关性而已。 协方差的计算公式如下:
在这里插入图片描述
5.协方差矩阵
在统计学与概率论中,协方差矩阵的每个元素是各个向量元素之间的协方差,是从标量随机变量到高维度随机向量的自然推广
协方差矩阵(Covariance matrix)由随机变量集合中两两随机变量的协方差组成。矩阵的第i行第j列的元素是随机变量集合中第i和第j个随机变量的协方差。假设我们有三个n维随机变量X,Y,Z(一般而言,在实际应用中这里的随机变量就是数据的不同维度。切记:协方差矩阵计算的是不同维度之间的协方差,而不是不同样本之间的协方差。):
在这里插入图片描述
则n维随机变量X,Y,Z的协方差矩阵为:
在这里插入图片描述
其中每个元素值的计算都可以利用上面计算协方差的公式进行。

二、马氏距离(Mahalanobis Distance)

1.定义
马氏距离(Mahalanobis distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示点与一个分布之间的距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是,它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为μ,协方差矩阵为Σ的多变量行向量x(设x有m个分量,且每个分量都是n维列向量),其马氏距离矩阵为:
在这里插入图片描述
其中
在这里插入图片描述
可以发现,(x-μ)T是m×n矩阵,Σ是n×n矩阵,(x-μ)是n×m矩阵,所以DM(x)是m×m矩阵,衡量的是向量x不同分量两两之间的马氏距离。

2.马哈拉诺比斯距离也可以定义为两个服从同一分布并且其协方差矩阵为Σ 的样本点x与y的差异程度:
在这里插入图片描述
假设x,y都是3维向量,那么由于(x-y)T是1×3矩阵,Σ的逆是3×3矩阵(因为这里我们的数据点有3个维度的属性),(x-y)是3×1矩阵,所以d(x,y)是一个1×1的数值,衡量的是x与y之间的马氏距离。

3.两个样本点的马氏距离计算示例:
在这里插入图片描述

Matlab计算协方差矩阵验算(矩阵a的列代表属性,行代表样本点):

在这里插入图片描述
得到协方差矩阵后,我们就可以计算出v和x之间的马氏距离了:

在这里插入图片描述

Matlab验算:

在这里插入图片描述

切记:协方差矩阵计算的是不同维度之间的协方差,而不是不同样本之间的协方差!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/153968.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Visual Studio 2010 旗舰版免序列号安装体验

    Visual Studio 2010 旗舰版免序列号安装体验VisualStudio2010E文版已经发布多时,由于工作原因没有及早的下载体验,直到前几天园子里的朋友放出了下载简体中文的种子ed2k://|file|cn_visual_studio_2010_ultimate_x86_dvd_532347.iso|2685982720|4AE6228933DDE49D9BFA4C3467C831C2|/于是决定下来体验一把,网速慢,2.5G下了2…

    2022年7月20日
    13
  • 禁用360浏览器6.2自带的Flash Player

    禁用360浏览器6.2自带的Flash Player360浏览器6.2自带了FlashPlayer,版本为11.6,而我需要使用最新版的FlashPlayer11.9,我安装了最新版的FlashPlayer11.9后,浏览网页时,360浏览器6.2默认使用的是自带的FlashPlayer11.6因此我们必须禁用掉360浏览器自带的FlashPlayer11.6——————————

    2022年6月11日
    44
  • 股票API

    实时股票数据接口大全股票数据的获取目前有如下两种方法可以获取:1.http/javascript接口取数据2.web-service接口1.http/javascript接口取数据1.1Sina股票数据接口以大秦铁路(股票代码:601006)为例,如果要获取它的最新行情,只需访问新浪的股票数据接口:http://hq.sinajs…

    2022年4月7日
    61
  • go分析和kegg分析_GO和KEGG富集分析(Metascape数据库)「建议收藏」

    介绍生物信息学研究中,获取基因列表的GO和KEGG富集分析的需求非常常见。目前有许多生物信息学手段或者数据库可以实现基因富集分析,例如DAVID,但它们有些是收费的,有些不易于使用且很少维护。例如DAVID曾经有六年的时间(2010-2016)没有维护数据库,最近的更新也已经两年半了。而Metascape每月更新其相关的40多个数据库,以确保提供最准确的结果。因此Metascape数据库可以作为富…

    2022年4月18日
    101
  • 为joomla加入�下拉菜单的方法

    为joomla加入�下拉菜单的方法

    2021年12月6日
    36
  • C#没有.sln文件怎么办?

    C#没有.sln文件怎么办?如果你的C#文件夹下没有.sln文件,你可以用VisualStudio软件,文件->打开->项目/解决方案,在指定的文件夹下找到.csproj文件,在你关闭时,会提示你保存成.sln文件,以后就可以直接打开了。

    2022年6月6日
    167

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号