SPSS中如何进行快速聚类分析「建议收藏」

SPSS中如何进行快速聚类分析「建议收藏」作为广受数据分析师青睐的一款数据统计和分析软件,IBMSPSSStatistics中有全面的数据分析方法,今天我们要介绍的是它的聚类分析中的快速聚类分析。一、方法概述聚类分析是将研究对象按照一定的标准进行分类的方法,分类结果是每一组的对象都具有较高的相似度,组间的对象具有较大的差异。这类分析方法多用于对于数据样本没有特定的分类依据的情况,IBMSPSSStatistics会通过对数据的观察为用户做出较为完善的分类。图1:功能位置快速聚类是聚类分析的一种,使用到的功能在“分析”

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

作为广受数据分析师青睐的一款数据统计和分析软件,IBM SPSS Statistics中有全面的数据分析方法,今天我们要介绍的是它的聚类分析中的快速聚类分析

一、方法概述

聚类分析是将研究对象按照一定的标准进行分类的方法,分类结果是每一组的对象都具有较高的相似度,组间的对象具有较大的差异。

这类分析方法多用于对于数据样本没有特定的分类依据的情况,IBM SPSS Statistics会通过对数据的观察为用户做出较为完善的分类。

1

图1:功能位置

快速聚类是聚类分析的一种,使用到的功能在“分析”——“分类”中的“K-均值聚类”。

二、案例分享

1.样本数据

2

图2:样本数据

我们这里选择的数据样本是一部分学生的各科期末成绩,使用快速聚类方法可以分析各个学生成绩分布的差异和共性。

2.变量设置

3

图3:变量设置

我们将学生的所有单科成绩作为分析变量,移入到“变量”窗口中,将学生的编号变量移入到下侧的“个案标记依据”窗口。

聚类数设置的是分类的数目,这个需要根据数据样本的特点来设置,我们这里设置为4类。

聚类方法有两类,即迭代和分类,前者较为复杂,会在分析过程中不断移动凝聚点,后者则始终使用初始凝聚点,我们选择两类都有的第一种分析方法。

3.聚类中心

4

图4:聚类中心

用户可以选择从外部文件或数据文件中写入或读取聚类中心,本案例中我们不使用这个功能。

4.迭代设置

5

图5:迭代设置

我们可以设置迭代的终止条件,即到达设定的最大值后将停止迭代分析,输出聚类分析结果。

收敛性标准设置的是凝聚点改变的最大距离小于初始凝聚点的比例,小于设定值时,也会停止迭代,输出结果。

使用运行均值表示每次观测后都重新计算凝聚点,这些设置保持默认即可。

5.保存

6

图6:保存新变量

这是用来设置保存形式的,勾选“聚类成员”将保存SPSS的分类结果,勾选“与聚类中心的距离”将保存观测值和所属类别的欧氏距离,我们不做设置。

6.选项

7

图7:选项设置

这个对话框设置的是输出的统计量和个案缺失处理方法,勾选“初始聚类中心”和“每个个案的聚类信息”。

7.结果输出

8

图8:聚类结果

在输出日志中可以看到,这些学生根据他们的单科成绩被分成了四类,SPSS输出了多个表格,包括初始聚类中心、迭代历史记录、聚类成员、最终聚类中心、最终聚类中心之间的距离和每个聚类中的个案数目,完整详细,可信度较高。

三、小结

使用IBM SPSS Statistics进行快速聚类的方法和案例分享就是这么多啦,这是一个较为常用的分类分析法,适用程度很高,希望可以对大家有所帮助!

如果您对SPSS也有兴趣,欢迎进入IBM SPSS Statistics中文网站下载试用!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/180973.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • webbench源码分析_webpack原理和机制

    webbench源码分析_webpack原理和机制webbench是一种网站的压力测试工具,它是由Lionbridge公司开发,wenbench的标准测试可以向我们展示两项内容:每秒钟相应的请求数和每秒钟传输的数据量;。webbench不但能具有便准静态页面的测试能力,还能对动态页面(ASP,PHP,Java,CGI)进行测试的能力。还有就是他支持对含有SSL的安全网站例如电子商务网站进行静态或动态的性能测试。Webbench最多可以模拟3

    2025年6月10日
    3
  • JMESPath_正则表达式语法

    JMESPath_正则表达式语法前言JMESPath是JSON的查询语言。您可以从JSON文档中提取和转换元素官方文档:https://jmespath.org/tutorial.html基本表达式JMESPath用的最多的

    2022年7月30日
    9
  • php set_time_limit()用法测试详解「建议收藏」

    php set_time_limit()用法测试详解

    2022年2月10日
    34
  • 如何将本地文件传到虚拟机linux_怎么把文件放到虚拟机里的系统里

    如何将本地文件传到虚拟机linux_怎么把文件放到虚拟机里的系统里一、使用FileZilla上传文件1.启动虚拟机,打开Linux终端,输入ifconfig命令查看IP地址IP地址为192.168.59.62.打开FileZilla,输入IP地址,用户名,密码,端口号,点击快速连接连接成功后,左边为本机资源目录,右边为虚拟机目录,左边选中文件,右键选择上传,即可上传成功二、使用SecureCRT或Xshell上…

    2022年8月22日
    191
  • Python爬虫以及数据可视化分析「建议收藏」

    Python爬虫以及数据可视化分析「建议收藏」Python爬虫以及数据可视化分析之B站动漫排行榜信息爬取分析简书地址:https://www.jianshu.com/u/40ac87350697简单几步,通过Python对B站番剧排行数据进行爬取,并进行可视化分析源码文件可以参考Github上传的项目:https://github.com/Lemon-Sheep/Py/tree/master下面,我们开始吧!PS:作为Python爬虫初学者,如有不正确的地方,望各路大神不吝赐教[抱拳]本项目将会对B站番剧排行的数据进行网页信息爬取以及

    2022年6月16日
    32
  • LaTex数学公式_markdown怎么写数学公式

    LaTex数学公式_markdown怎么写数学公式LaTeX数学公式,包含前言,注意事项,插入公式,注释,编号,转义字符,换行与对齐,字体,空格,上下标,括号,大括号和行标,分式,开方,对数,省略号,最值,方程组和分段函数,累加和累乘,矢量,积分,极限,导数与偏导,矩阵,表格,希腊字母,运算符,戴帽符号,特殊符号,等等。

    2022年5月3日
    62

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号