R语言描述性统计函数总结

R语言描述性统计函数总结描述性统计 1 使用 summary 函数来获取描述性统计量 summary 函数提供了最大值 最小值 四分位数和数值型变量的均值以及因子向量和逻辑向量的频数统计例子 myvars lt c mpg hp wt summary mtcars myvars mpghpwtMin

myvars <- c("mpg","hp","wt") summary(mtcars[myvars]) mpg hp wt Min. :10.40 Min. : 52.0 Min. :1.513 1st Qu.:15.43 1st Qu.: 96.5 1st Qu.:2.581 Median :19.20 Median :123.0 Median :3.325 Mean :20.09 Mean :146.7 Mean :3.217 3rd Qu.:22.80 3rd Qu.:180.0 3rd Qu.:3.610 Max. :33.90 Max. :335.0 Max. :5.424 

自定义描述性统计函数

> mystats <- function(x,na.omit=FALSE) + { + if(na.omit) + x <- x[!is.na(x)] + m <- mean(x) + n <- length(x) + s <- sd(x) + #计算偏度 + skew <- sum((x-m)^3/s^3)/n + #计算峰度 + kurt <- sum((x-m)^4/s^4)/n-3 + return(c(n=n,mean=m,stdev=s,skew=skew,kurtosis=kurt)) + } > sapply(mtcars[myvars],mystats) mpg hp wt n 32.000000 32.0000000 32.00000000 mean 20.090625 146. 3. stdev 6.026948 68. 0. skew 0. 0. 0. kurtosis -0. -0. -0.0 > apply(mtcars[myvars],2,mystats) mpg hp wt n 32.000000 32.0000000 32.00000000 mean 20.090625 146. 3. stdev 6.026948 68. 0. skew 0. 0. 0. kurtosis -0. -0. -0.0 
> library(Hmisc) > Hmisc::describe(mtcars[myvars]) mtcars[myvars] 3 Variables 32 Observations ------------------------------------------------------------------------------------------ mpg n missing distinct Info Mean Gmd .05 .10 .25 .50 32 0 25 0.999 20.09 6.796 12.00 14.34 15.43 19.20 .75 .90 .95 22.80 30.09 31.30 lowest : 10.4 13.3 14.3 14.7 15.0, highest: 26.0 27.3 30.4 32.4 33.9 ------------------------------------------------------------------------------------------ hp n missing distinct Info Mean Gmd .05 .10 .25 .50 32 0 22 0.997 146.7 77.04 63.65 66.00 96.50 123.00 .75 .90 .95 180.00 243.50 253.55 lowest : 52 62 65 66 91, highest: 215 230 245 264 335 ------------------------------------------------------------------------------------------ wt n missing distinct Info Mean Gmd .05 .10 .25 .50 32 0 29 0.999 3.217 1.089 1.736 1.956 2.581 3.325 .75 .90 .95 3.610 4.048 5.293 lowest : 1.513 1.615 1.835 1.935 2.140, highest: 3.845 4.070 5.250 5.345 5.424 ------------------------------------------------------------------------------------------ > 
> stat.desc(mtcars[myvars]) mpg hp wt nbr.val 32.0000000 32.0000000 32.0000000 nbr.null 0.0000000 0.0000000 0.0000000 nbr.na 0.0000000 0.0000000 0.0000000 min 10. 52.0000000 1. max 33. 335.0000000 5. range 23. 283.0000000 3. sum 642. 4694.0000000 102. median 19. 123.0000000 3. mean 20.0 146. 3. SE.mean 1.0 12. 0. CI.mean.0.95 2. 24. 0. var 36. 4700. 0. std.dev 6.0 68. 0. coef.var 0. 0. 0. > stat.desc(mtcars[myvars],norm = TRUE) mpg hp wt nbr.val 32.0000000 32.00000000 32.00000000 nbr.null 0.0000000 0.00000000 0.00000000 nbr.na 0.0000000 0.00000000 0.00000000 min 10. 52.00000000 1. max 33. 335.00000000 5. range 23. 283.00000000 3. sum 642. 4694.00000000 102. median 19. 123.00000000 3. mean 20.0 146. 3. SE.mean 1.0 12. 0. CI.mean.0.95 2. 24. 0. var 36. 4700. 0. std.dev 6.0 68. 0. coef.var 0. 0. 0. skewness 0. 0. 0. skew.2SE 0. 0. 0. kurtosis -0. -0. -0.0 kurt.2SE -0. -0.0 -0.0 normtest.W 0. 0. 0. normtest.p 0. 0.0 0.0 > 
 library(psych) > myvars <- c("mpg","hp","wt") > describe(mtcars[myvars]) vars n mean sd median trimmed mad min max range skew kurtosis se mpg 1 32 20.09 6.03 19.20 19.70 5.41 10.40 33.90 23.50 0.61 -0.37 1.07 hp 2 32 146.69 68.56 123.00 141.19 77.10 52.00 335.00 283.00 0.73 -0.14 12.12 wt 3 32 3.22 0.98 3.33 3.15 0.77 1.51 5.42 3.91 0.42 -0.02 0.17 > 
aggregate(mtcars[myvars],by=list(am=mtcars$am),mean) am mpg hp wt 1 0 17.14737 160.2632 3. 2 1 24.39231 126.8462 2. 
dstats <- function(x)sapply(x,mystats) > myvars <- c("mpg","hp","wt") > by(mtcars[myvars],mtcars$am,dstats) mtcars$am: 0 mpg hp wt n 19.00000000 19.00000000 19.0000000 mean 17. 160. 3. stdev 3. 53. 0. skew 0.0 -0.0 0. kurtosis -0. -1. 0. ------------------------------------------------------------------- mtcars$am: 1 mpg hp wt n 13.00000000 13.0000000 13.0000000 mean 24. 126. 2. stdev 6. 84.0 0. skew 0.0 1. 0. kurtosis -1. 0. -1. 
 myvars <- c("mpg","hp","wt") > summaryBy(mpg+hp+wt~am,data=mtcars,FUN=mystats) am mpg.n mpg.mean mpg.stdev mpg.skew mpg.kurtosis hp.n hp.mean hp.stdev hp.skew 1 0 19 17.14737 3. 0.0 -0. 19 160.2632 53.90820 -0.0 2 1 13 24.39231 6. 0.0 -1. 13 126.8462 84.06232 1. hp.kurtosis wt.n wt.mean wt.stdev wt.skew wt.kurtosis 1 -1. 19 3. 0. 0. 0. 2 0. 13 2. 0. 0. -1. 
library(psych) > describeBy(mtcars[myvars],list(am=mtcars$am)) Descriptive statistics by group am: 0 vars n mean sd median trimmed mad min max range skew kurtosis se mpg 1 19 17.15 3.83 17.30 17.12 3.11 10.40 24.40 14.00 0.01 -0.80 0.88 hp 2 19 160.26 53.91 175.00 161.06 77.10 62.00 245.00 183.00 -0.01 -1.21 12.37 wt 3 19 3.77 0.78 3.52 3.75 0.45 2.46 5.42 2.96 0.98 0.14 0.18 ------------------------------------------------------------------- am: 1 vars n mean sd median trimmed mad min max range skew kurtosis se mpg 1 13 24.39 6.17 22.80 24.38 6.67 15.00 33.90 18.90 0.05 -1.46 1.71 hp 2 13 126.85 84.06 109.00 114.73 63.75 52.00 335.00 283.00 1.36 0.56 23.31 wt 3 13 2.41 0.62 2.32 2.39 0.68 1.51 3.57 2.06 0.21 -1.17 0.17 
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/227212.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午9:41
下一篇 2026年3月16日 下午9:41


相关推荐

  • org.apache.ibatis.binding.BindingException原因总结

    org.apache.ibatis.binding.BindingException原因总结今天遇到 mybatis 的报错 搞了好久才搞懂 在网上找了好久的相似案例 也没有搞定 先来看下网上常见的解决办法吧 相信也能解决大部分人的报错 排查方法如下 1 mapper 接口和 mapper xml 是否在同一个包 package 下 名字是否一样 仅后缀不同 2 mapper xml 的命名空间 namespace 是否跟 mapper 接口的包名一致 3 接口的方法名 与 xml 中的一

    2026年3月19日
    2
  • Linux: sctp 实例

    Linux: sctp 实例https://www.opensourceforu.com/2011/12/socket-api-part-5-sctp/需要安装lksctp-tools-develyuminstalllksctp-tools-devel编译需要-lsctpgccserver.c-lsctp-oserverClient,调用connet函数时,会触发SCTP-INIT消息,消息里的IPaddress列表是根据当前机器所配置的所有IP地址来填充,如何配置这个地址列表呢?:__sctp_con

    2022年6月23日
    36
  • java求最大公约数

    java求最大公约数

    2021年7月15日
    60
  • java反射小样例

    java反射小样例

    2021年12月8日
    47
  • java事务_Java 事务详解[通俗易懂]

    java事务_Java 事务详解[通俗易懂]一、事务(1)事务(Transaction),一般是指要做的或所做的事情。在计算机术语中是指访问并可能更新数据库中各种数据项的一个程序执行单元(unit)。(2)事务应该具有4个属性:原子性、一致性、隔离性、持久性。这四个属性通常称为ACID特性。原子性(atomicity)。一个事务是一个不可分割的工作单位。比如A向B转账1000元,那么这就一定要保证原子性(要么同时成功,要么同时失败)。一致性…

    2022年10月13日
    4
  • opencv-python的位运算cv2.bitwise_and,cv2.bitwise_not使用及效果展示

    opencv-python的位运算cv2.bitwise_and,cv2.bitwise_not使用及效果展示考虑下面两张图片 怎样得到下面的效果 这里使用按位运算的方法 第一步 截取操作区域 img1 cv2 imread material images 23126 92 jpg img2 cv2 imread material images opencv jpg rows cols channels img2 shaperoi im

    2026年3月18日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号