基于FCM算法的聚类算法

文章目录

一、模糊聚类分析
二、案例背景
- 1、问题描述
- 2、模糊C–均值聚类算法(FCM)
三、MATLAB程序实现
四、参考文献

一、模糊聚类分析

模糊聚类是目前知识发现以及模式识别等诸多领域中的重要研究分支之一。随着研究范围的拓展，不管是科学研究还是实际应用，都对聚类的结果从多方面提出了更高的要求。模糊C–均值聚类(FCM)是目前比较流行的一种聚类方法。该方法使用了在欧几里得空间确定数据点的几何贴近度的概念，它将这些数据分配到不同的聚类，然后确定这些聚类之间的距离。模糊C–均值聚类算法在理论和应用上都为其他的模糊聚类分析方法奠定了基础，应用也最广泛。

二、案例背景

1、问题描述

图1 400个随机样本数据

2、模糊C–均值聚类算法(FCM)

设 $n$ 个数据样本为 $\boldsymbol X=\{x_1, x_2,\cdots,x_n\}$ ， $c (2 \leq c \leq n)$ 是要将数据样本分成的类型的数目， $\{A_1,A_2,\cdots,A_c\}$ 表示相应的 $c$ 个类别， $\boldsymbol U$ 是其相似分类矩阵，各类别的聚类中心为 $\{v_1,v_2,\cdots,v_c\}$ ， $\mu_k(x_i)$ 是样本 $x_i$ 对于类 $A_k$ 的隶属度(简写为 $\mu_{ik}$ )。则目标函数 $J_b$ 可以用下式表达： $J_b(\boldsymbol U,v)=\sum_{i=1}^n\sum_{k=1}^c(\mu_{ik})^b(d_{ik})^2\tag{1}$ 其中， $d_{ik}=d(x_i-v_k)=\sqrt{\displaystyle\sum_{j=1}^m(x_{ij}-v_{kj})^2}$ 。 $d_{ik}$ 是欧几里得距离，用来度量第 $i$ 个样本 $x_i$ 与第 $k$ 类中心点之间的距离； $m$ 是样本的特征数； $b$ 是加权参数，取值范围是 $1 \leq b \leq \infty$ 。模糊C–均值聚类方法就是寻找一种最佳的分类，以使该分类能产生最小的函数值 $j_b$ 。它要求一个样本对于各个聚类的隶属度值和为1，即满足 $\sum_{j=1}^c\mu_j(x_i)=1,\quad i=1,2,\cdots,n\tag{2}$ 式(3)和式(4)分别用于计算样本 $x_i$ 对于类 $A_k$ 的隶属度 $\mu_{ik}$ 和 $c$ 个聚类中心 ${v_i\}$ ： $\mu_{ik}=\frac{1}{\displaystyle\sum_{j=1}^c\left(\frac{d_{ik}}{d_{jk}}\right)^{\frac{2}{b-1}}}\tag{3}$ 设 $I_k=\{i|2≤c＜n;d_{ik}=0\}$ ，对于所有的 $i$ 类， $i∈I_k$ ， $\mu_{ik}=0$ 。 $v_{ij}=\frac{\displaystyle\sum_{k=1}^n(\mu_{ik})^bx_{kj}}{\displaystyle\sum_{k=1}^n(\mu_{ik})^b}\tag{4}$ 用式(3)和式(4)反复修改聚类中心、数据隶属度和进行分类，当算法收敛时，理论上就得到了各类的聚类中心以及各个样本对于各模式类的隶属度，从而完成了模糊聚类划分。尽管FCM有很高的搜索速度，但FCM是一种局部搜索算法，且对聚类中心的初值十分敏感，如果初值选择不当，它会收敛到局部极小点。
算法推导过程见文献[2]。

三、MATLAB程序实现

1、初始化

%% 初始化参数 data = rand(400, 2); figure; plot(data(:, 1), data(:, 2), 'ro', 'MarkerSize', 8); xlabel '横坐标X'; ylabel '纵坐标'; title '样本数据'; K = 4; % 分类个数 maxgen = 100; % 最大迭代次数 alpha = 3; % 指数的次幂 threshold = 1e-6; % 阈值 [data_n, in_n] = size(data); % 行数，即样本个数/列数，即样本维数 % 初始化隶属度矩阵 U = rand(K, data_n); col_sum = sum(U); U = U./col_sum(ones(K, 1), :);

2、更新聚类中心、目标函数值、隶属度矩阵

% 更新聚类中心 mf = U.^alpha; center = mf*data./((ones(in_n, 1)*sum(mf'))'); % 更新目标函数值 dist = zeros(size(center, 1), data_n); for k = 1:size(center, 1) dist(k, :) = sqrt(sum(((data-ones(data_n, 1)*center(k, :)).^2)', 1)); end J(i) = sum(sum((dist.^2).*mf)); % 更新隶属度矩阵 tmp = dist.^(-2/(alpha-1)); U = tmp./(ones(K, 1)*sum(tmp)); % 终止条件判断 if i > 1 if abs(J(i) - J(i-1)) < threshold break; end end

3、程序源码

具体程序代码如下：

%% 清空环境变量 clear; clc; close all; %% 初始化参数 data = rand(400, 2); figure; plot(data(:, 1), data(:, 2), 'ro', 'MarkerSize', 8); xlabel '横坐标X'; ylabel '纵坐标'; title '样本数据'; K = 4; % 分类个数 maxgen = 100; % 最大迭代次数 alpha = 3; % 指数的次幂 threshold = 1e-6; % 阈值 [data_n, in_n] = size(data); % 行数，即样本个数/列数，即样本维数 % 初始化隶属度矩阵 U = rand(K, data_n); col_sum = sum(U); U = U./col_sum(ones(K, 1), :); %% 迭代 for i = 1:maxgen % 更新聚类中心 mf = U.^alpha; center = mf*data./((ones(in_n, 1)*sum(mf'))'); % 更新目标函数值 dist = zeros(size(center, 1), data_n); for k = 1:size(center, 1) dist(k, :) = sqrt(sum(((data-ones(data_n, 1)*center(k, :)).^2)', 1)); end J(i) = sum(sum((dist.^2).*mf)); % 更新隶属度矩阵 tmp = dist.^(-2/(alpha-1)); U = tmp./(ones(K, 1)*sum(tmp)); % 终止条件判断 if i > 1 if abs(J(i) - J(i-1)) < threshold break; end end end %% 绘图 [max_vluae, index] = max(U); index = index'; figure; for i = 1:K col = find(index == i); % max(U)返回隶属度列最大值所在行一致的分为一类 plot(data(col, 1), data(col, 2), '*', 'MarkerSize', 8); hold on end grid on % 画出聚类中心 plot(center(:, 1), center(:, 2), 'p', 'color', 'm', 'MarkerSize', 12); xlabel '横坐标X'; ylabel '纵坐标Y'; title 'FCM优化后的聚类图'; % 目标函数变化过程 figure; plot(J, 'r', 'linewidth', 2); xlabel '迭代次数'; ylabel '目标函数值'; title 'FCM聚类目标函数变化过程'; grid on

4、结果分析

图2 FCM优化后的聚类图

图3 FCM聚类目标函数值变化过程

四、参考文献

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/221066.html原文链接：https://javaforall.net

基于FCM算法的聚类算法

文章目录

一、模糊聚类分析

二、案例背景

1、问题描述

2、模糊C–均值聚类算法(FCM)

三、MATLAB程序实现

1、初始化

2、更新聚类中心、目标函数值、隶属度矩阵

3、程序源码

4、结果分析

四、参考文献

关于作者

全栈程序员-站长

发表回复

基于FCM算法的聚类算法

文章目录

一、模糊聚类分析

二、案例背景

1、问题描述

2、模糊C–均值聚类算法(FCM)

三、MATLAB程序实现

1、初始化

2、更新聚类中心、目标函数值、隶属度矩阵

3、程序源码

4、结果分析

四、参考文献

关于作者

全栈程序员-站长

相关推荐

ChatGPT API中转站 – 2025最新OpenAI O3 API服务

c语言 修改文件权限666,chmod 777 修改权限

第20章，运维自动化之ansible

startActivityForResult解析

视频要不要开hdr_hdr在什么情况下使用

【转载】TCP的三次握手(建立连接）和四次挥手(关闭连接）

发表回复

c语言修改文件权限666,chmod 777 修改权限