stata 导出 相关系数表_STATA数据处理技巧与计量分析二|基本语句介绍

stata 导出 相关系数表_STATA数据处理技巧与计量分析二|基本语句介绍更多精彩内容请关注211统计课堂上期小统和大家一起了解了STATA数据处理技巧与计量分析的背景介绍,这期小统和大家一起学习一下基本语句介绍。Stata操作界面核心功能(dofile)Stata中的命令集合文件,在编程语言中成为脚本(scripts),是指为达到某一分析目的进行的数据读取、数据处理、分析等的命令集合。Stata的基础语法基本语法结构:funNamevariable/(v…

大家好,又见面了,我是你们的朋友全栈君。

faf37c3e4163be56ec150937eea92f1e.gif

更多精彩内容请关注211统计课堂

上期小统和大家一起了解了STATA数据处理技巧与计量分析的背景介绍,这期小统和大家一起学习一下基本语句介绍。

Stata操作界面

7d696b5c51a7d5b965499542a7491526.png

核心功能 (do file) Stata中的命令集合文件,在编程语言中成为脚本(scripts),是指为达到某一分析目的进行的数据读取、数据处理、分析等的命令集合。

58f0eaedc201cc1646522cbd612db6d4.png

4eb1ee295e44c7471690bbb2fec10642.png

Stata的基础语法

基本语法结构:

funName variable/(var list) if/in, by() other options

generate newVar=var1/var2

summarize var1 var2 newVar if group==1

regress indepVar depVar1 depVar2 depVar3,robust

•任何的实证分析,收集到的数据形形色色,格式不一。

•因此,很多时候,数据清洗或者初步的数据处理成为了最重要的环节。。。

数据导入与保存:

help insheet  //可以导入csv或者txt数据文件(常用)

help import excel  //导入excel文件(常用)

help import sasxport  //导入sas文件(少用)

help use //导入dta文件(常用)

help save  //保存为dta数据文件

eg:

insheet  using “dataset.csv”,clear

import excel  “dataset.xls”,firstrow sheet(Sheet1) clear

use dataset.dta,clear

save dataset2.dta,replace

数据处理常用命令:

help gen  //赋值、计算变量(加减乘除、乘方,逻辑运算)

help egen  //可以计算任何描述统计指标、分组。常与bysort组合使用,功能非常强大!

help replace  //替换数据,常结合if使用

help destring //数字变量处理

help encode  //对个体变量进行编号,分组变量或者面板数据常用

eg:

gen newVar=var1/var2  //两个变量相除

gen Year2017=(year==2017)  //2017年的虚拟变量设置

egen meanVar=mean(var)   //求某一个变量的均值

bysort industry:egen meanVar=max(var)

replace var1=0 if var1==.  //把var1为缺失值的赋值为0

destring var1,replace  //把文本格式的变量转化为数值变量

encode Stkcd,gen(Stkcd1)  //个体数据进行数值化(编号)

数据探索命令——计量分析第一步

help summarize  //描述统计(观测数、均值、标准差、最小值、最大值)

help tabstat  //更为常用,可以自定义统计指标,并导出到excel

help winsor  //缩尾处理,每次只能处理一个变量

help winsor2  //外部缩尾处理命令,更为方便,可多变量处理。

help scatter //绘制两个变量之间的散点图

help pwcorr  //计算相关系数表格

eg:

sum var1 var2

tabstat var1 var2,stat(mean n sd max min median) c(s) 

winsor2 var1 var2,replace cuts(1 99)

scatter y x

pwcorr var1 var2 var3,sig  //报告p值

pwcorr var1 var2 var3,star(0.05)  //把p值小于0.05的用*标记

小结:

•全部的处理都可以菜单式操作,但是不建议用。除非在你忘记命令如何写或者某些option不知道如何写的时候。

•对于任何指标的计算,本课程介绍的命令基本上可以解决90%以上。多思考。多层bysort+egen能发挥你意想不到的威力。

•数据清洗是每次实证分析的最基础最重要最耗时的一步,你的目标是把数据集中全部红色的变量变为蓝色或者黑色

•还有更多的操作技巧,等你慢慢发掘。

8cfa7f036b472c0e97b63346aff30fdd.png

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/149316.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ajax跨域问题以及解决方案_js跨域请求的三种方法

    ajax跨域问题以及解决方案_js跨域请求的三种方法出于浏览器的同源策略限制。同源策略(Sameoriginpolicy)是一种约定,它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,则浏览器的正常功能可能都会受到影响。可以说Web是构建在同源策略基础之上的,浏览器只是针对同源策略的一种实现。同源策略会阻止一个域的javascript脚本和另外一个域的内容进行交互。所谓同源(即指在同一个域)就是两个页面具有相同的协议(protocol),主机(host)和端口号(port)AJAX跨域请求下面简单模拟一个场景—–>>前端有.

    2022年8月24日
    5
  • 算法学习笔记之一阶低通滤波算法

    算法学习笔记之一阶低通滤波算法1.一阶滤波算法的原理一阶滤波,又叫一阶惯性滤波,或一阶低通滤波。是使用软件编程实现普通硬件RC低通滤波器的功能。一阶低通滤波的算法公式为:Y(n)=αX(n)(1-α)Y(n-1)式中:α=滤波系数;X(n)=本次采样值;Y(n-1)=上次滤波输出值;Y(n)=本次滤波输出值。一阶低通滤波法采用本次采样值与

    2022年6月11日
    198
  • 大盘进入涨势的条件

    大盘进入涨势的条件 春节以来,上证指数120分钟,所有的拐点都在这里了,除了本次,春节以来所有“顶、底”信号全部成功,皆为120分钟的拐点,所以,从周四开始,我就开始提示:不追买《120分钟顶信号》。即便是120分钟不能撼动日线的底部,那么你买在120分钟的顶位置,很显然,也是不对的。 120分钟顶,不追买是首要任务,其次呢,我们重点分析120分钟顶失败的意义。双龙之翼的顶底指标,是震荡类指标,即专门狙杀震荡拐点的…

    2022年6月29日
    22
  • 《深入解析IPv6(第3版)》——第10章 IPv6路由选择10.1 IPv6中的路由选择

    《深入解析IPv6(第3版)》——第10章 IPv6路由选择10.1 IPv6中的路由选择

    2022年3月2日
    32
  • 实现PC视频播放最强画质教程( Potplayer播放器+MADVR插件)【转】

    实现PC视频播放最强画质教程( Potplayer播放器+MADVR插件)【转】转自:http://www.hangge.com/blog/cache/detail_1461.html一、MADVR介绍MADVR 是一款超强的视频插件,其配合高清播放软件,可以做到目前 PC 上播放高清视频的最强画质。MADVR 这款视频渲染器比市面上大多数播放器自带的渲染器有着更精确的颜色处理,更高质量的图像缩放缩放、以及更低的颜色错误率。这就使得它所渲染出来的视频在颜色上更…

    2022年9月14日
    0
  • acwing-246. 区间最大公约数(线段树+gcd)[通俗易懂]

    acwing-246. 区间最大公约数(线段树+gcd)[通俗易懂]给定一个长度为 N 的数列 A,以及 M 条指令,每条指令可能是以下两种之一:C l r d,表示把 A[l],A[l+1],…,A[r] 都加上 d。Q l r,表示询问 A[l],A[l+1],…,A[r] 的最大公约数(GCD)。对于每个询问,输出一个整数表示答案。输入格式第一行两个整数 N,M。第二行 N 个整数 A[i]。接下来 M 行表示 M 条指令,每条指令的格式如题目描述所示。输出格式对于每个询问,输出一个整数表示答案。每个答案占一行。数据范围N≤500000,M≤1

    2022年8月9日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号