python多因素方差分析_双因素方差分析例题

python多因素方差分析_双因素方差分析例题在实际应用中,一个实验的指标往往受到多个因素的影响。例如饮料的销量有可能受到销售地区或者饮料颜色的影响。在方差分析中,若把饮料的颜色看做影响销量的因素A,把销售地区看做影响因素B。同时对因素A和因素B进行分析,就称为双因素方差分析。a b ca1 b1 20a1 b2 22a1 b3 24a1 b4 16a1 b5 26a2 b1 12a2 b2 10a2 b3 14a2 b…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

在实际应用中,一个实验的指标往往受到多个因素的影响。

例如饮料的销量有可能受到销售地区或者饮料颜色的影响。在方差分析中,若把饮料的颜色看做影响销量的因素A,把销售地区看做影响因素B。同时对因素A和因素B进行分析,就称为双因素方差分析。

a	b	c
a1	b1	20
a1	b2	22
a1	b3	24
a1	b4	16
a1	b5	26
a2	b1	12
a2	b2	10
a2	b3	14
a2	b4	4
a2	b5	22
a3	b1	20
a3	b2	20
a3	b3	18
a3	b4	8
a3	b5	16
a4	b1	10
a4	b2	12
a4	b3	18
a4	b4	6
a4	b5	20
a5	b1	14
a5	b2	6
a5	b3	10
a5	b4	18
a5	b5	10

from statsmodels.formula.api import ols from statsmodels.stats.anova import anova_lm formula = 'c~ a + b ' anova_results = anova_lm(ols(formula,df).fit()) print(anova_results) 
            df  sum_sq  mean_sq         F    PR(>F)
a          4.0  335.36    83.84  3.874307  0.021886
b          4.0  199.36    49.84  2.303142  0.103195
Residual  16.0  346.24    21.64       NaN       NaN

检验的结论:

因素A的p值0.021886<0.05,拒绝原假设,说明饮料颜色对销量有显著影响;而因素B的p值0.103195>0.05,不能拒绝原假设,因此没有充分的理由说明销售地区对销量有显著影响。

然而,我们知道了颜色对销量有显著影响,那么是哪种颜色呢?
使用tukey方法对颜色进行多重比较

from statsmodels.stats.multicomp import pairwise_tukeyhsd print(pairwise_tukeyhsd(df['c'], df['a'])) 
Multiple Comparison of Means - Tukey HSD,FWER=0.05
==============================================
group1 group2 meandiff  lower    upper  reject
----------------------------------------------
  1      2      -9.2   -19.0855  0.6855 False 
  1      3      -5.2   -15.0855  4.6855 False 
  1      4      -8.4   -18.2855  1.4855 False 
  1      5     -10.0   -19.8855 -0.1145  True 
  2      3      4.0    -5.8855  13.8855 False 
  2      4      0.8    -9.0855  10.6855 False 
  2      5      -0.8   -10.6855  9.0855 False 
  3      4      -3.2   -13.0855  6.6855 False 
  3      5      -4.8   -14.6855  5.0855 False 
  4      5      -1.6   -11.4855  8.2855 False 
----------------------------------------------

结果说明:1和5的reject=True,说明这两种颜色有显著性差异

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/184737.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • java 整数规划_线性规划与整数规划求解速度对比

    java 整数规划_线性规划与整数规划求解速度对比文章发表于微信公众号【数据魔术师】:线性规划&整数规划求解速度PK线性规划&整数规划求解速度PK​mp.weixin.qq.com相信大家对线性规划和整数规划应该不陌生,在开始今天的问题之前我们不妨再来复习一下这两个概念,毕竟温故而知新嘛线性规划与整数规划线性规划是这样定义的:求解线性规划问题的基本方法是单纯形法,后来又有改进单纯形法、对偶单纯形法等。而整数(线性)规划则是在线性规…

    2022年7月12日
    15
  • Mac Navicat12.0.22 安装手册和操作说明[通俗易懂]

    Mac Navicat12.0.22 安装手册和操作说明[通俗易懂]小编的系统是MacOSCatalina10.15.4、NavicatPremiumMac12.0.22MacNavicat安装与使用

    2025年8月10日
    4
  • linux下安装tomcat8

    linux下安装tomcat8(一)安装JDK环境64位JDK包:http://download.oracle.com/otn-pub/java/jdk/8u45-b14/jdk-8u45-linux-x64.tar.gz1.用 SecureCRT链接上linux,用命令直接下载 wget http://download.oracle.com/otn-pub/java/jdk/8u45-b14/jdk-8u45

    2022年6月2日
    44
  • [MFC]同步对象——CCriticalSection临界区,CSemaphore信号量

    [MFC]同步对象——CCriticalSection临界区,CSemaphore信号量实例——CCriticalSection临界区临界区是保证在某一个时间只有一个线程可以访问数据的方法。使用它的过程中,需要给每个线程提供一个共享的临界区对象,无论哪个线程占有临界区对象,都可以访问受到保护的数据,这时候其他的线程需要等待,直至该线程释放临界区对象为止,临界区被释放后,另外的线程可以强占这个临界区,以便访问共享的数据。临界区对应的一个CCriticalSection对象,

    2022年7月20日
    21
  • FEC编码_无线电FEC

    FEC编码_无线电FECFEC编码:ES流:也叫基本码流,包含视频、音频或数据的连续码流.PES流:也叫打包的基本码流,是将基本码流ES流根据需要分成长度不等的数据包,并加上包头就形成了打包的基本码流PES流.TS流:也叫传输流,是由固定长度为188字节的包组成,含有独立时基的一个或多个节目,适用于误码较多的环境.在DVB-S标准中,只规定了1/2、2/3、3/4、5/6、7/8这5种FEC码率,为什么只规定这5…

    2022年8月11日
    6
  • 过分了,别人用来做桌面应用开发,这家伙却用来撩妹(4)–双向奔赴的火柴人

    过分了,别人用来做桌面应用开发,这家伙却用来撩妹(4)–双向奔赴的火柴人

    2022年2月21日
    46

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号