基于灰色关联度分析法_灰色关联度分析法的优缺点

基于灰色关联度分析法_灰色关联度分析法的优缺点本文介绍了利用灰色关联度分析方法分析了数据之间的关联度。

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

灰色关联分析介绍

对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的量度,称为关联度。在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。
通常可以运用此方法来分析各个因素对于结果的影响程度,也可以运用此方法解决随时间变化的综合评价类问题。

灰色关联分析的步骤

灰色系统关联分析的具体计算步骤如下:

  1. 确定反映系统行为特征的参考数列和影响系统行为的比较数列。
    反映系统行为特征的数据序列,称为参考数列(可以理解为因变量)。影响系统行为的因素组成的数据序列,称比较数列(可以理解为自变量)。
  2. 对参考数列和比较数列进行无量纲化处理。
    由于系统中各因素的物理意义不同,导致数据的量纲也不一定相同,不便于比较,或在比较时难以得到正确的结论。因此在进行灰色关联度分析时,一般都要进行无量纲化的数据处理。
  3. 求参考数列与比较数列的灰色关联系数ξ(Xi)
    所谓关联程度,实质上是曲线间几何形状的差别程度。因此曲线间差值大小,可作为关联程度的衡量尺度。对于一个参考数列X0有若干个比较数列X1, X2,…, Xn,各比较数列与参考数列在各个时刻(即曲线中的各点)的关联系数ξ(Xi)可由下列公式算出:

在这里插入图片描述
其中 ρ为分辨系数,ρ>0,ρ越小,分辨力越大,一般ρ的取值区间为(0,1),具体取值可视情况而定。通常取0.5。
minmin是第二级最小差,记为Δmin。 maxmax是两级最大差,记为Δmax。
在这里插入图片描述
为各比较数列Xi曲线上的每一个点与参考数列X0曲线上的每一个点的绝对差值,记为Δoi(k)。
所以关联系数ξ(Xi)也可简化如下列公式:
在这里插入图片描述

  1. 求关联度ri
    因为关联系数是比较数列与参考数列在各个时刻(即曲线中的各点)的关联程度值,所以它的数不止一个,而信息过于分散不便于进行整体性比较。因此有必要将各个时刻(即曲线中的各点)的关联系数集中为一个值,即求其平均值,作为比较数列与参考数列间关联程度的数量表示,关联度ri公式如下:
    在这里插入图片描述

  2. 关联度排序
    因素间的关联程度,主要是用关联度的大小次序描述,而不仅是关联度的大小。将m个子序列对同一母序列的关联度按大小顺序排列起来,便组成了关联序,记为{x},它反映了对于母序列来说各子序列的“优劣”关系。若r0i>r0j,则称{xi}对于同一母序列{x0}优于{xj},记为{xi}>{xj} ;若r0i表1 代表旗县参考数列、比较数列特征值。

实例

#灰色关联度分析
import pandas as p
import numpy as np
from numpy import *
import matplotlib.pyplot as plt
%matplotlib inline

# 从硬盘读取数据进入内存
wine = pd.read_csv("...\\是.csv",encoding="ANSI")
wine.head()
wine=wine.dropna()
wine.dropna()
# 无量纲化()
newDataFrame=pd.DataFrame(index=wine.index)
columns=wine.columns.tolist()
for c in columns:
        d = wine[c]
        MAX = d.max()
        MIN = d.min()
        MEAN = d.mean()
        newDataFrame[c] = ((d - MEAN) / (MAX - MIN)).tolist()
print(newDataFrame)
# 提取参考队列和比较队列
newDataFrame=newDataFrame.iloc[:,1:].T
ck=newDataFrame.iloc[0,:]
cp=newDataFrame.iloc[1:,:]#比较
#比较队列与参考列相减
t=pd.DataFrame()
for j in range(cp.index.size):
    temp=pd.Series(cp.iloc[j,:]-ck)
    t=t.append(temp,ignore_index=True)
#求最大差和最小差
mmax=t.abs().max().max()
mmin=t.abs().min().min()
rho=0.5
#求关联系数
ksi=((mmin+rho*mmax)/(abs(t)+rho*mmax))
pd.DataFrame(ksi)
# 灰色关联结果矩阵可视化
import seaborn as sns
def ShowGRAHeatMap(DataFrame):
    colormap = plt.cm.RdBu
    ylabels = DataFrame.columns.values.tolist()
    f, ax = plt.subplots(figsize=(14, 14))
    ax.set_title('GRA HeatMap')    
    # 设置展示一半,如果不需要注释掉mask即可
    #mask = np.zeros_like(DataFrame)
    #mask[np.triu_indices_from(mask)] = True
    
    with sns.axes_style("white"):
        sns.heatmap(DataFrame,
                    cmap="rainbow",
                    annot=True,
                    #mask=mask,
                   )
   
    plt.rcParams['font.sans-serif']='SimHei'
    plt.show()
data=pd.DataFrame(ksi)
ShowGRAHeatMap(data)

#求关联度
r=ksi.sum(axis=1)/ksi.columns.size
print("关联度为:\n",r)
#关联度排序,
result=r.sort_values(ascending=False)
print("关联度排序结果为:\n",result)

Jetbrains全家桶1年46,售后保障稳定

关联系数矩阵:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/206688.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 使用tcpdump抓包分析网络请求_抓包报文分析

    使用tcpdump抓包分析网络请求_抓包报文分析tcpdump是一个用于截取网络分组,并输出分组内容的工具,简单说就是数据包抓包工具。tcpdump凭借强大的功能和灵活的截取策略,使其成为Linux系统下用于网络分析和问题排查的首选工具。tcpdump提供了源代码,公开了接口,因此具备很强的可扩展性,对于网络维护和入侵者都是非常有用的工具。tcpdump存在于基本的Linux系统中,由于它需要将网络界面设置为混杂模式,普通用户不能正常执行,但具备root权限的用户可以直接执行它来获取网络上的信息。因此系统中存在网络分析工具主要不是对本机安全的威胁,而是对

    2022年10月14日
    2
  • DropDownList1_SelectedIndexChanged-的使用

    DropDownList1_SelectedIndexChanged-的使用怎样使当DropDownList1改变时也改变相应的DropDownList2的值?实现二级联动。如省市联动啊。以下有代码。将DropDownList1的AutoPostBack属性设为true导入命名空间ImportsSystem.DataImportsSystem.Data.SqlClientPrivateSubPage_Load(ByValsen

    2022年7月18日
    13
  • hexdump 命令「建议收藏」

    hexdump 命令「建议收藏」大概整明白了-e里边这个format到底怎么写。模仿man里边的命令demo改了一个能用hexdump-e‘”0x%08_ax:”4/4″%08x”“\n”’plt|less搞清楚的含义:%08_ax:08是输出按8个字符的长度输出,高位补0;_a是输出offset;x是按16进制;4/4:第一个4是每行四次输出;第二个4是每次输出4个byte0x00000000:464c457f0001010100000000000000000x00000010:000300

    2022年9月21日
    3
  • c语言面试笔试题_c语言面试题库

    c语言面试笔试题_c语言面试题库121、为了避免嵌套的条件语句if-else的二义性,C语言规定:else与(B)匹配。A)缩排位置相同的ifB)其之前最近的ifC)其之后ifD)同一行上的if122、设i和x都是int类型,则对于for循环语句for(i=0,x=0;i<9;i++),下列哪句语正确(B)A)执行8次B)执行9次C)是无限循环D)循环体一次也不执行123、下面程序的运行结果是(C…

    2022年8月27日
    5
  • Django(53)二次封装Response

    Django(53)二次封装Response前言有时候我们使用drf的Response,会发现默认返回的格式不太友好,每次我们都需要写入以下的格式returnResponse({"status":0,"

    2022年7月31日
    10
  • 谷歌离线地图开发_谷歌实时在线街景地图

    谷歌离线地图开发_谷歌实时在线街景地图离线地图开发主要有两部分组成:1、获取离线地图数据;因为离线地图一般都是局域网,所以需要离线地图数据放在内网中使用;2、离线地图服务器搭建以及二次开发接口提供,离线地图是一种服务,就像我们Apache提供的WEB服务器一样,他是一种准们的地图服务:提供了包括WEB服务、TMS服务、WMTS服务等等。离线地图数据的获取:可以通过【大地图下载器】下载到。要进…

    2022年9月20日
    7

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号