SPSS中如何进行快速聚类分析「建议收藏」

SPSS中如何进行快速聚类分析「建议收藏」作为广受数据分析师青睐的一款数据统计和分析软件,IBMSPSSStatistics中有全面的数据分析方法,今天我们要介绍的是它的聚类分析中的快速聚类分析。一、方法概述聚类分析是将研究对象按照一定的标准进行分类的方法,分类结果是每一组的对象都具有较高的相似度,组间的对象具有较大的差异。这类分析方法多用于对于数据样本没有特定的分类依据的情况,IBMSPSSStatistics会通过对数据的观察为用户做出较为完善的分类。图1:功能位置快速聚类是聚类分析的一种,使用到的功能在“分析”

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

作为广受数据分析师青睐的一款数据统计和分析软件,IBM SPSS Statistics中有全面的数据分析方法,今天我们要介绍的是它的聚类分析中的快速聚类分析

一、方法概述

聚类分析是将研究对象按照一定的标准进行分类的方法,分类结果是每一组的对象都具有较高的相似度,组间的对象具有较大的差异。

这类分析方法多用于对于数据样本没有特定的分类依据的情况,IBM SPSS Statistics会通过对数据的观察为用户做出较为完善的分类。

1

图1:功能位置

快速聚类是聚类分析的一种,使用到的功能在“分析”——“分类”中的“K-均值聚类”。

二、案例分享

1.样本数据

2

图2:样本数据

我们这里选择的数据样本是一部分学生的各科期末成绩,使用快速聚类方法可以分析各个学生成绩分布的差异和共性。

2.变量设置

3

图3:变量设置

我们将学生的所有单科成绩作为分析变量,移入到“变量”窗口中,将学生的编号变量移入到下侧的“个案标记依据”窗口。

聚类数设置的是分类的数目,这个需要根据数据样本的特点来设置,我们这里设置为4类。

聚类方法有两类,即迭代和分类,前者较为复杂,会在分析过程中不断移动凝聚点,后者则始终使用初始凝聚点,我们选择两类都有的第一种分析方法。

3.聚类中心

4

图4:聚类中心

用户可以选择从外部文件或数据文件中写入或读取聚类中心,本案例中我们不使用这个功能。

4.迭代设置

5

图5:迭代设置

我们可以设置迭代的终止条件,即到达设定的最大值后将停止迭代分析,输出聚类分析结果。

收敛性标准设置的是凝聚点改变的最大距离小于初始凝聚点的比例,小于设定值时,也会停止迭代,输出结果。

使用运行均值表示每次观测后都重新计算凝聚点,这些设置保持默认即可。

5.保存

6

图6:保存新变量

这是用来设置保存形式的,勾选“聚类成员”将保存SPSS的分类结果,勾选“与聚类中心的距离”将保存观测值和所属类别的欧氏距离,我们不做设置。

6.选项

7

图7:选项设置

这个对话框设置的是输出的统计量和个案缺失处理方法,勾选“初始聚类中心”和“每个个案的聚类信息”。

7.结果输出

8

图8:聚类结果

在输出日志中可以看到,这些学生根据他们的单科成绩被分成了四类,SPSS输出了多个表格,包括初始聚类中心、迭代历史记录、聚类成员、最终聚类中心、最终聚类中心之间的距离和每个聚类中的个案数目,完整详细,可信度较高。

三、小结

使用IBM SPSS Statistics进行快速聚类的方法和案例分享就是这么多啦,这是一个较为常用的分类分析法,适用程度很高,希望可以对大家有所帮助!

如果您对SPSS也有兴趣,欢迎进入IBM SPSS Statistics中文网站下载试用!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/180973.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 架构要素-高可用性[通俗易懂]

    架构要素-高可用性

    2022年1月31日
    41
  • nginx实现tomcat动静分离详解

    nginx实现tomcat动静分离详解1.为什么要实现动静分离1)nginx的处理静态资源能力超强主要是nginx处理静态页面的效率远高于tomcat的处理能力,如果tomcat的请求量为1000次,则nginx的请求量为6000次,tomcat每秒的吞吐量为0.6M,nginx的每秒吞吐量为3.6M,可以说,nginx处理静态资源的能力是tomcat处理能力的6倍,优势可见一斑。2)动态资源和静态资源分开,使服务器结构更

    2022年6月4日
    29
  • vscode 前端常用插件推荐「建议收藏」

    1.vscode简介vscode是微软开发的的一款代码编辑器,就如官网上说的一样,vscode重新定义(redefined)了代码编辑器。 当前市面上常用的轻型代码编辑器主要是:sublime,notepad++,editplus,atom这几种。 比起notepad++、editplus,vscode集成了许多IDE才具有的功能,比起它们更像一个代码编辑器; 比起sublime,…

    2022年4月7日
    57
  • 常见的预测模型及算法「建议收藏」

    常见的预测模型及算法「建议收藏」如果得到一份数据集,任务是要预测出一系列的值,而在预测任务中,我们大多数都采用的是拟合的方法,这篇文字主要介绍三种预测方法时间序列分析,灰色预测模型,神经网络。时间序列分析时间序列也叫动态序列,数据是按时间和数值性成的序列。而时间序列分析有三种作用,大致可以描述为描述过去,分析规律,预测将来。接下来将会讲到三种模型(季节分解,指数平滑,ARIMA模型)。一般情况下时间序列的数值变化规律有四种…

    2022年6月23日
    28
  • ribbon默认的负载均衡策略_集群负载均衡策略

    ribbon默认的负载均衡策略_集群负载均衡策略官方文档指出:自定义的负载均衡配置类不能放在@componentScan所扫描的当前包下及其子包下,否则我们自定义的这个配置类就会被所有的Ribbon客户端所共享,也就是说我们达不到特殊化定制的目的了;要求自定义的算法:依旧是轮询策略,但是每个服务器被调用5次后轮到下一个服务,即以前是每个服务被调用1次,现在是每个被调用5次。打开消费者工程:1、自定义算法类必须继承AbstractLoadBalanceRule类启动类在com.bruce.springcloud包下,所以我们新建一个包:

    2022年10月8日
    0
  • laravel5数据库配置及其注意事项

    laravel5数据库配置及其注意事项

    2021年10月20日
    35

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号