怎么用excel做回归分析_用excel做数据分析

怎么用excel做回归分析_用excel做数据分析Excel数据分析工具库是个很强大的工具,可以满足基本的统计分析,这里介绍用Excel数据分析工具库中的回归做回归分析。本文仅作为学习笔记之用,欢迎各位交流指正。本节知识点: Excel数据分析工具库—回归 线性回归和非线性回归 简单线性回归和多重线性回归 逻辑斯蒂回归 一、什么是回归分析(Regression)1、定义确定两种…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

Excel数据分析工具库是个很强大的工具,可以满足基本的统计分析,这里介绍用Excel数据分析工具库中的回归做回归分析。本文仅作为学习笔记之用,欢迎各位交流指正。

本节知识点:

  • Excel数据分析工具库—回归

  • 线性回归和非线性回归

  • 简单线性回归和多重线性回归

  • 逻辑斯蒂回归

  •  

一、什么是回归分析(Regression)

1、定义

确定两种或两种以上变量间相关关系的一种统计分析方法。通过数据间相关性分析的研究,进一步建立自变量(i=1,2,3,…)与因变量Y之间的回归函数关系,即回归分析模型,从而预测数据的发展趋势。

 

2、分类

  • 按照涉及的变量的多少,分为一元回归和多元回归分析;

  • 按照因变量的多少,可分为简单回归分析和多重回归分析;

  • 按照自变量因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

 

二、线性回归

1、简单线性回归

简单线性回归又叫一元线性回归,即回归模型中只有一个自变量和一个因变量,其回归方程可以表示为:

Y=a+bx+怎么用excel做回归分析_用excel做数据分析

其中,Y表示因变量,x表示自变量,a是 常数,b是斜率,怎么用excel做回归分析_用excel做数据分析是随机误差。

 

2、最小二乘法

如何确定参数a和b,则要用最小二乘法来实现。通过最小化误差的平方和寻找数据的最佳函数匹配,即使得观测点和估计点的距离的平方和最小。

 

3、线性回归分析的步骤:

  • 确定自变量和因变量

  • 绘制散点图,确定回归模型类型

  • 估计模型参数,建立回归模型:最小二乘法进行模型参数估计

  • 对回归模型进行检验

  • 利用回归模型进行预测

 

4、多重线性回归

定义:一个因变量与多个自变量的线性回归问题,是一元线性回归的推广。其回归方程可以写为:

怎么用excel做回归分析_用excel做数据分析 

多重线性回归方程中回归系数的估计也是用到最小二乘法

 

三、用Excel做回归分析

我们研究销售额Y和推广费用X1之间的关系,数据如下:

怎么用excel做回归分析_用excel做数据分析

首先我们用数据分析—相关系数分析计算一下自变量和因变量之间的相关系数为0.95157,为强相关。

怎么用excel做回归分析_用excel做数据分析

 

绘制散点图如下:

怎么用excel做回归分析_用excel做数据分析

 

然后,我们用数据分析库里的回归来做分析

怎么用excel做回归分析_用excel做数据分析

 

注意Y值和X值输入区域,X值是自变量,Y是因变量。

怎么用excel做回归分析_用excel做数据分析

 

四、线性回归方程的检验

评价回归拟合程度好坏(重要):

怎么用excel做回归分析_用excel做数据分析

1、  先看回归统计表,Multiple R即相关系数R的值,和我们之前做相关分析得到的值一样,大于0.8表示强正相关。

 

2、  回归统计表中的R Square是R平方值,R平方即R的平方,又可以叫判定系数、拟合优度,取值范围是[0,1],R平方值越大,表示模型拟合的越好。一般大于70%就算拟合的不错,60%以下的就需要修正模型了。这个案例里R平方0.9054,相当不错。

 

3、  Adjusted R是调整后的R方,这个值是用来修正因自变量个数增加而导致模型拟合效果过高的情况,多用于衡量多重线性回归。

 

4、  第二张表,方差分析表,df是自由度,SS是平方和,MS是均方,F是F统计量,Significance F是回归方程总体的显著性检验,其中我们主要关注F检验的结果,即Significance F值,F检验主要是检验因变量与自变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当,越小越显著。这个案例里F值很小,说明因变量与自变量之间显著。

 

5、  残差是实际值与预测值之间的差,残差图用于回归诊断,回归模型在理想条件下的残差图是服从正态分布的。

 

6、   第三张表我们重点关注P-value,也就是P值,用来检验回归方程系数的显著性,又叫T检验,T检验看P值,是在显著性水平α(常用取值0.01或0.05)下F的临界值,一般以此来衡量检验结果是否具有显著性,如果P值>0.05,则结果不具有显著的统计学意义,如果0.01<P值<0.05,则结果具有显著的统计学意义,如果P<=0.01,则结果具有极其显著的统计学意义。T检验是看某一个自变量对于因变量的线性显著性,如果该自变量不显著,则可以从模型中剔除。

 

7、   从第三张表的第一列我们可以得到这个回归模型的方程:y=4361.486+1.198017x,此后对于每一个输入的自变量x,都可以根据这个回归方程来预测出因变量Y。

 

这里简单总结了一下什么是回归分析,以及如何用excel做线性回归分析,入门很简单,精通还很遥远,我们都在学习中。

 

下一节内容:用Excel做直方图(2):频率分布直方图

 

@文章属原创,转载请联系作者

@作者:虾壳,在数据分析的道路上努力奔跑

@微信公众号:可乐的数据分析之路

怎么用excel做回归分析_用excel做数据分析

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/226855.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ssm框架过时了吗_ssm和mvc框架

    ssm框架过时了吗_ssm和mvc框架日志如果一个数据库操作,出现了异常,我们需要排错,日志就是最好的助手曾经:sout,debug现在:日志工厂掌握STDOUT_LOGGINGLOG4Jlog4j什么是Log4j?我们可以控制日志信息输送的目的地是控制台我们也可以控制每一条日志的输出格式通过定义每一条日志信息的级别,我们能够更加细致地控制日志的生成过程通过一个配置文件来灵活地进行配置,而不需要修改应用的代码。分页减少数据量selsect * from user limit startIndex,pageS

    2022年8月8日
    6
  • pytest运行_ios自动清理缓存

    pytest运行_ios自动清理缓存前言pytest运行完用例之后会生成一个.pytest_cache的缓存文件夹,用于记录用例的ids和上一次失败的用例。方便我们在运行用例的时候加上–lf和–ff参数,快速运行上一

    2022年7月28日
    11
  • vue v-if 多条件_vue vnode

    vue v-if 多条件_vue vnodev-if在模板中,可以根据条件进行渲染。条件用到的是v-if、v-else-if以及v-else来组合实现的。示例代码如下:<divid="app"><p

    2022年8月7日
    3
  • java-多态

    java-多态

    2021年9月29日
    43
  • DOS下的Tree命令

    DOS下的Tree命令    有时候我们想了解一个文件夹或者驱动器根目录下的所有文件,并希望它以资源管理器的树形视图方式显示文件结构。如果你使用的是Windows 2000,可以在“命令提示符”窗口中输入“tree D:Inetpub”命令(这里的 D:Inetpub可以根据需要改成要你查阅的文件路径),就会看到D:Inetpub下的所有文件夹以树形结构清楚地显示出来。    此外,你还可以加入以下参数以增强“tree

    2022年7月24日
    8
  • java 图书馆管理系统(面向接口编程)

    java 图书馆管理系统(面向接口编程)图书馆管理系统功能要求:1.图书馆(对书本的管理)  1.初始化图书馆的书本  2.图书馆有提供借书给用户的功能  3.图书馆有提供用户还书到图书馆的功能  4.图书馆提供查询图书馆的所有图书的功能2.用户系统(对用户管理)  1.初始化用户  2.用户管理提供注册用户的功能(用户名:首字母小写,至少6位。密码:必须包含小写字母,大写字

    2022年7月7日
    33

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号