数据挖掘-层次聚类

数据挖掘-层次聚类微信搜索 二十同学 公众号 欢迎关注一条不一样的成长之路层次聚类 hierarchical 算法极为简单 有 N 多节点 最开始认为每个节点为一类 然后找到距离最近的节点 两两合并 合并后的两个节点的平均值作为新的节点 继续两两合并的过程 直到最后都合并成一类 下图表明了聚类的过程 距离最近的节点合并 第一步中 如果有两对节点距离一样 那就同时合并 层次聚类过程如果用数据挖掘工具来做 如 SPSS 一般会生成一个树形图 那么我们可以根据分析问题的具体情况 选

微信搜索:“二十同学” 公众号,欢迎关注一条不一样的成长之路

层次聚类(hierarchical clustering)算法极为简单:有N多节点,最开始认为每个节点为一类,然后找到距离最近的节点“两两合并”,合并后的两个节点的平均值作为新的节点,继续两两合并的过程,直到最后都合并成一类。

下图表明了聚类的过程,距离最近的节点合并(第一步中,如果有两对节点距离一样,那就同时合并)

 

数据挖掘-层次聚类

层次聚类过程

如果用数据挖掘工具来做(如SPSS),一般会生成一个树形图,那么我们可以根据分析问题的具体情况,选择到底最终要聚成几类:

数据挖掘-层次聚类

层次聚类树形图

 

如果从纯理论上讲,判断聚成几类可以参考每一步合并的“距离”是不是有明显差距,我们的例子中:

可见,第二步到第三步,距离有了一个质的提升,说明相对接近的都已经合成一推儿,开始远距离“结合”了,因此,就在第二步的地方结束,应该是一个较好的聚类选择,也就是聚成3类。

当然,真正聚成几类一定不要从理论出发,还是要看实际案例中,聚成几类最合理,最好解释,最能说明问题

层次聚类运算速度比较慢,因为要每次都要计算多个cluster内所有数据点的两两距离,处理大量数据时非常吃力,最大的优点,就是它一次性地得到了整个聚类的过程,只要得到了上面那样的聚类树,想要分多少个cluster都可以直接根据树结构来得到结果,改变 cluster数目不需要再次计算数据点的归属。

 

非常感谢:点赞收藏评论

微信搜索:“二十同学” 公众号,或者直接扫一扫,关注一条不一样的成长之路

数据挖掘-层次聚类

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/231371.html原文链接:https://javaforall.net

(0)
上一篇 2026年1月15日 上午10:01
下一篇 2026年1月15日 上午10:22


相关推荐

  • 三、行列式的几何意义

    三、行列式的几何意义三 行列式的几何意义 nbsp 行列式的定义 行列式是由一些数据排列成的方阵经过规定的计算方法而得到的一个数 当然 如果行列式中含有未知数 那么行列式就是一个多项式 它本质上代表一个数值 这点请与矩阵区别开来 矩阵只是一个数表 行列式还要对这个数表按照规则进一步计算 最终得到一个实数 复数或者多项式 一阶行列式 注意不是绝对值 二阶行列式三阶行列式 N 阶行列式

    2026年3月26日
    2
  • Linux mount 命令

    Linux mount 命令mount 命令用来挂载文件系统 其基本命令格式为 mount ttype ooptions devicedirdev 指定要挂载的设备 比如磁盘 光驱等 dir 指定把文件系统挂载到哪个目录 type 指定挂载的文件系统类型 一般不用指定 mount 命令能够自行判断 options 指定挂载参数 比如 ro 表示以只读方式挂载文件系统 Help 可以通过 manpage 和 h 选项来获得最直接的帮助文档 manmount mount h 文件系统的类型

    2026年3月18日
    1
  • RS-422接口定义

    RS-422接口定义RS-422接口定义什么是RS-422接口? RS-422的电气性能与RS-485完全一样。主要的区别在于: RS-422有4根信号线:两根发送(Y、Z)、两根接收(A、B)。由于RS-422的收与发 是分开的所以可以同时收和发(全双工)。RS-485有2根信号线:发送和接收都是A和B。由于RS-485的收与发是共用两根线所以不能够同时收和发(半双

    2022年5月2日
    79
  • MySql 的严格模式

    MySql 的严格模式设置当前数据库的严格模式 1 可以通过执行 SQL 语句来开启 但是只对当前连接有效 下面是 SQL 语句 当前临时严格模式 setsql mode STRICT TRANS TABLES NO AUTO CREATE USER NO ENGINE SUBSTITUTION 2 通过修改 MySQL 的配置文件 my default ini 在配置文件中查

    2025年8月6日
    8
  • 更省更快更聪明!国内首个OpenClaw中文版Molili 1.0.7版本刚刚上线

    更省更快更聪明!国内首个OpenClaw中文版Molili 1.0.7版本刚刚上线

    2026年3月16日
    2
  • 2026年win10和win7双系统安装教程

    2026年win10和win7双系统安装教程

    2026年3月12日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号