如何利用matlab进行聚类分析_什么是聚类分析

如何利用matlab进行聚类分析_什么是聚类分析1.用Matlab编程实现运用Matlab中的一些基本矩阵计算方法,通过自己编程实现聚类算法,在此只讨论根据最短距离规则聚类的方法。调用函数:min1.m——求矩阵最小值,返回最小值所在行和列以及值的大小min2.m——比较两数大小,返回较小值std1.m——用极差标准化法标准化矩阵ds1.m——用绝对值距离法求距离矩阵cluster.m——应用最短距离聚类法进行聚类分析print1.m——调用…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

1. 用Matlab编程实现

运用Matlab中的一些基本矩阵计算方法,通过自己编程实现聚类算法,在此只讨论根据最短距离规则聚类的方法。

调用函数:

min1.m——求矩阵最小值,返回最小值所在行和列以及值的大小

min2.m——比较两数大小,返回较小值

std1.m——用极差标准化法标准化矩阵

ds1.m——用绝对值距离法求距离矩阵

cluster.m——应用最短距离聚类法进行聚类分析

print1.m——调用各子函数,显示聚类结果

聚类分析算法

假设距离矩阵为vector, a阶,矩阵中最大值为max,令矩阵上三角元素等于max

聚类次数=a-1,以下步骤作a-1次循环:

求改变后矩阵的阶数,计作c

求矩阵最小值,返回最小值所在行e和列f以及值的大小g

forl=1:c,为vector(c+1,l)赋值,产生新类

令第c+1列元素,第e行和第f行所有元素为,第e列和第f列所有元素为max

源程序如下:

%std1.m,用极差标准化法标准化矩阵

function std=std1(vector)

max=max(vector);       %对列求最大值

min=min(vector);

[a,b]=size(vector);          %矩阵大小,a为行数,b为列数

for i=1:a

forj=1:b

std(i,j)= (vector(i,j)-min(j))/(max(j)-min(j));

end

end

%ds1.m,用绝对值法求距离

function d=ds1(vector);

[a,b]=size(vector);

d=zeros(a);

for i=1:a

forj=1:a

for k=1:b

d(i,j)=d(i,j)+abs(vector(i,k)-vector(j,k));

end

end

end

fprintf(‘绝对值距离矩阵如下:\n’);

disp(d)

%min1.m,求矩阵中最小值,并返回行列数及其值

function [v1,v2,v3]=min1(vector);%v1为行数,v2为列数,v3为其值

[v,v2]=min(min(vector’));

[v,v1]=min(min(vector));

v3=min(min(vector));

%min2.m,比较两数大小,返回较小的值

function v1=min(v2,v3);

if v2>v3

v1=v3;

else

v1=v2;

end

%cluster.m,最短距离聚类法

function result=cluster(vector);

[a,b]=size(vector);

max=max(max(vector));

for i=1:a

for j=i:b

vector(i,j)=max;

end

end;

for k=1:(b-1)

[c,d]=size(vector);

fprintf(‘第%g次聚类:\n’,k);

[e,f,g]=min1(vector);

fprintf(‘最小值=%g,将第%g区和第%g区并为一类,记作G%g\n\n’,g,e,f,c+1);

forl=1:c

ifl<=min2(e,f)

vector(c+1,l)=min2(vector(e,l),vector(f,l));

else

vector(c+1,l)=min2(vector(l,e),vector(l,f));

end

end;

vector(1:c+1,c+1)=max;

vector(1:c+1,e)=max;

vector(1:c+1,f)=max;

vector(e,1:c+1)=max;

vector(f,1:c+1)=max;

end

%print1,调用各子函数

function print=print1(filename,a,b); %a为地区个数,b为指标数

fid=fopen(filename,’r’)

vector=fscanf(fid,’%g’,[a b]);

fprintf(‘标准化结果如下:\n’)

v1=std1(vector)

v2=ds1(v1);

cluster(v2);

%输出结果

print1(‘fname’,9,7)

2.直接调用Matlab函数实现

2.1调用函数

层次聚类法(Hierarchical Clustering)的计算步骤:

①计算n个样本两两间的距离{dij},记D

②构造n个类,每个类只包含一个样本;

③合并距离最近的两类为一新类;

④计算新类与当前各类的距离;若类的个数等于1,转到5);否则回3);

⑤画聚类图;

⑥决定类的个数和类;

Matlab软件对系统聚类法的实现(调用函数说明):

cluster                  从连接输出(linkage)中创建聚类

clusterdata              从数据集合(x)中创建聚类

dendrogram             画系统树状图

linkage                 连接数据集中的目标为二元群的层次树

pdist                 计算数据集合中两两元素间的距离(向量)

squareform             将距离的输出向量形式定格为矩阵形式

zscore                  对数据矩阵 X 进行标准化处理

各种命令解释

⑴ T =clusterdata(X, cutoff)

其中X为数据矩阵,cutoff是创建聚类的临界值。即表示欲分成几类。

以上语句等价与以下几句命令:

Y=pdist(X,’euclid’)

Z=linkage(Y,’single’)

T=cluster(Z,cutoff)

以上三组命令调用灵活,可以自由选择组合方法!

⑵ T =cluster(Z, cutoff)

从逐级聚类树中构造聚类,其中Z是由语句likage产生的(n-1)×3阶矩阵,cutoff是创建聚类的临界值。

⑶ Z = linkage(Y)           Z = linkage(Y, ‘method’)

创建逐级聚类树,其中Y是由语句pdist产生的n(n-1)/2 阶向量,’method’表示用何方法,默认值是欧氏距离(single)。有’complete’——最长距离法;‘average’——类平均距离;‘centroid’——重心法 ;‘ward‘——递增平方和等。

⑷ Y = pdist(X)         Y = pdist(X,’metric’)

计算数据集X中两两元素间的距离, ‘metric’表示使用特定的方法,有欧氏距离‘euclid’、标准欧氏距离‘SEuclid’、马氏距离‘mahal’、明可夫斯基距离‘Minkowski‘ 等。

⑸ H = dendrogram(Z)    H =dendrogram(Z, p)

由likage产生的数据矩阵z画聚类树状图。P是结点数,默认值是30。

2.2举例说明

设某地区有八个观测点的数据,样本距离矩阵如表1所示,根据最短距离法聚类分析。

%最短距离法系统聚类分析

X=[7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29;

7.6850.37 11.35 13.3 19.25 14.59 2.75 14.87;

9.4227.93 8.20 8.14 16.17 9.42 1.55 9.76;

9.1627.98 9.01 9.32 15.99 9.10 1.82 11.35;

10.0628.64 10.52 10.05 16.18 8.39 1.96 10.81];

BX=zscore(X); %标准化数据矩阵

Y=pdist(X)   %用欧氏距离计算两两之间的距离

D=squareform(Y)  %欧氏距离矩阵

Z = linkage(Y)   %最短距离法

T = cluster(Z,3) %等价于{T=clusterdata(X,3) }

find(T==3)  %第3类集合中的元素

[H,T]=dendrogram(Z)     %画聚类图

聚类谱系图如图1所示:

图1 聚类谱

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/183295.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • python粒子群算法的实现「建议收藏」

    python粒子群算法的实现「建议收藏」参考博客:http://blog.csdn.net/zuochao_2013/article/details/53431767?ref=myreadhttp://blog.csdn.net/chen_jp/article/details/7947059算法介绍粒子群算法(particleswarmoptimization,PSO)由Kennedy和Eberhart在1995年…

    2022年5月8日
    44
  • jmeter测试系统最大并发_jmeter高并发测试

    jmeter测试系统最大并发_jmeter高并发测试操作流程:1.先添加一个线程组2.添加一个查看树*多线程测试指的是在短时间内多次重复请求*多进程测试指的是同一时间内多次重复请求下面图文展示操作步骤:一、添加线程组先新建一个测试计划如下图:创建线程组:在新建的测试计划上右键如下图:线程组参数详解:1.线程数意思是请求多少次2.Ramp-UpPeriod(inseconds)…

    2022年9月30日
    0
  • winhttp 访问https_「winhttp」C++用winhttp实现https访问服务器 – seo实验室

    winhttp 访问https_「winhttp」C++用winhttp实现https访问服务器 – seo实验室winhttp由于项目升级,在数据传输过程中需要经过oauth2.0认证,访问服务器需要https协议。首先,实现C++代码访问https服务器,实现Get和post功能,在网上搜索一通,发现各种各样的都有,有的很简单,有的稍微复杂。结果MSDN介绍的比较简洁一点官方网址:https://docs.microsoft.com/en-us/windows/desktop/winhttp/ssl-i…

    2022年7月11日
    20
  • 微信小程序40029 错误解决方法

    微信小程序40029 错误解决方法首先报40029错误的方式有多个,但是错误原因应该只有一个。1:openid和当前小程序不对应,或者AppSecret秘钥和当前小程序不对应的。2:当前小程序能正确获取到token,但是在code还没有失效时,另一个小程序也用这个小程序的openid或者AppSecret秘钥去请求token。这个时候也会报40029,说到底还是第一个错误,只是触发的方式不同。解决办法也很简单,…

    2022年4月29日
    2.8K
  • sap安装配置_sapgui730安装指南

    sap安装配置_sapgui730安装指南一.下载和安装    WEBIDE是免安装的,下载完解压就行。       下载地址  Developerguid在线文档  在线文档打开会比较慢,可以下载下来观看。二.配置ABAP链接 在IDE的解压文件的配置文件夹中新建文件ER1(没有后缀名)  编辑新建文件添加如下内容:  Description=

    2022年10月18日
    0
  • 实现WORD文档、PDF文档在线预览:具体实现流程

    实现WORD文档、PDF文档在线预览:具体实现流程

    2021年7月8日
    103

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号