Java实现数据统计的常用算法

Java实现数据统计的常用算法Java实现数据统计的常用算法

大家好,又见面了,我是你们的朋友全栈君。

求和、平均值、众数、中位数、中列数、四分位数、极差、四分位数、截断均值、方差、绝对平均差(AAD)、中位数绝对偏差、标准差 的数学方法

package cn.javacodes.utils;


import java.util.Arrays;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

/** * 数据统计工具类 * @author 胡湛霏 * @since 2016-09-27 */
public class DataStatisticsUtils { 
   
    /** * 求和 * * @param arr * @return */
    public static double getSum(double[] arr) { 
   
        double sum = 0;
        for (double num : arr) { 
   
            sum += num;
        }
        return sum;
    }

    /** * 求均值 * * @param arr * @return */
    public static double getMean(double[] arr) { 
   
        return getSum(arr) / arr.length;
    }

    /** * 求众数 * * @param arr * @return */
    public static double getMode(double[] arr) { 
   
        Map<Double, Integer> map = new HashMap<Double, Integer>();
        for (int i = 0; i < arr.length; i++) { 
   
            if (map.containsKey(arr[i])) { 
   
                map.put(arr[i], map.get(arr[i]) + 1);
            } else { 
   
                map.put(arr[i], 1);
            }
        }
        int maxCount = 0;
        double mode = -1;
        Iterator<Double> iter = map.keySet().iterator();
        while (iter.hasNext()) { 
   
            double num = iter.next();
            int count = map.get(num);
            if (count > maxCount) { 
   
                maxCount = count;
                mode = num;
            }
        }
        return mode;
    }

    /** * 求中位数 * * @param arr * @return */
    public static double getMedian(double[] arr) { 
   
        double[] tempArr = Arrays.copyOf(arr, arr.length);
        Arrays.sort(tempArr);
        if (tempArr.length % 2 == 0) { 
   
            return (tempArr[tempArr.length >> 1] + tempArr[(tempArr.length >> 1) - 1]) / 2;
        } else { 
   
            return tempArr[(tempArr.length >> 1)];
        }
    }


    /** * 求中列数 * * @param arr * @return */
    public static double getMidrange(double[] arr) { 
   
        double max = arr[0], min = arr[0];
        for (int i = 0; i < arr.length; i++) { 
   
            if (arr[i] > max) { 
   
                max = arr[i];
            }
            if (arr[i] < min) { 
   
                min = arr[i];
            }
        }
        return (min + max) / 2;
    }

    /** * 求四分位数 * * @param arr * @return 存放三个四分位数的数组 */
    public static double[] getQuartiles(double[] arr) { 
   
        double[] tempArr = Arrays.copyOf(arr, arr.length);
        Arrays.sort(tempArr);
        double[] quartiles = new double[3];
        // 第二四分位数(中位数)
        quartiles[1] = getMedian(tempArr);
        // 求另外两个四分位数
        if (tempArr.length % 2 == 0) { 
   
            quartiles[0] = getMedian(Arrays.copyOfRange(tempArr, 0, tempArr.length / 2));
            quartiles[2] = getMedian(Arrays.copyOfRange(tempArr, tempArr.length / 2, tempArr.length));
        } else { 
   
            quartiles[0] = getMedian(Arrays.copyOfRange(tempArr, 0, tempArr.length / 2));
            quartiles[2] = getMedian(Arrays.copyOfRange(tempArr, tempArr.length / 2 + 1, tempArr.length));
        }
        return quartiles;
    }

    /** * 求极差 * * @param arr * @return */
    public static double getRange(double[] arr) { 
   
        double max = arr[0], min = arr[0];
        for (int i = 0; i < arr.length; i++) { 
   
            if (arr[i] > max) { 
   
                max = arr[i];
            }
            if (arr[i] < min) { 
   
                min = arr[i];
            }
        }
        return max - min;
    }

    /** * 求四分位数极差 * * @param arr * @return */
    public static double getQuartilesRange(double[] arr) { 
   
        return getRange(getQuartiles(arr));
    }

    /** * 求截断均值 * * @param arr 求值数组 * @param p 截断量p,例如p的值为20,则截断20%(高10%,低10%) * @return */
    public static double getTrimmedMean(double[] arr, int p) { 
   
        int tmp = arr.length * p / 100;
        double[] tempArr = Arrays.copyOfRange(arr, tmp, arr.length + 1 - tmp);
        return getMean(tempArr);
    }

    /** * 求方差 * * @param arr * @return */
    public static double getVariance(double[] arr) { 
   
        double variance = 0;
        double sum = 0, sum2 = 0;
        for (int i = 0; i < arr.length; i++) { 
   
            sum += arr[i];
            sum2 += arr[i] * arr[i];
        }
        variance = sum2 / arr.length - (sum / arr.length) * (sum / arr.length);
        return variance;
    }

    /** * 求绝对平均偏差(AAD) * * @param arr * @return */
    public static double getAbsoluteAverageDeviation(double[] arr) { 
   
        double sum = 0;
        double mean = getMean(arr);
        for (int i = 0; i < arr.length; i++) { 
   
            sum += Math.abs(arr[i] - mean);
        }
        return sum / arr.length;
    }

    /** * 求中位数绝对偏差(MAD) * * @param arr * @return */
    public static double getMedianAbsoluteDeviation(double[] arr) { 
   
        double[] tempArr = new double[arr.length];
        double median = getMedian(arr);
        for (int i = 0; i < arr.length; i++) { 
   
            tempArr[i] = Math.abs(arr[i] - median);
        }
        return getMedian(tempArr);
    }

    /** * 求标准差 * @param arr * @return */
    public static double getStandardDevition(double[] arr) { 
   
        double sum = 0;
        double mean = getMean(arr);
        for (int i = 0; i < arr.length; i++) { 
   
            sum += Math.sqrt((arr[i] - mean) * (arr[i] - mean));
        }
        return (sum / (arr.length - 1));
    }
}

数据规范化的代码整理:

package cn.javacodes.utils;

import java.util.Arrays;

/** * 数据变化-规范化工具类 * @author 胡湛霏 * @since 2016-09-27 */
public class DataConversionUtils { 
   

    /** * 最小-最大规范化 * * @param arr * @return 规范化后的数组 */
    public static double[] minMaxNormalize(double[] arr) { 
   
        // 拷贝数组
        double[] tempArr = Arrays.copyOf(arr, arr.length);
        // 找到最大值和最小值
        double max = tempArr[0], min = tempArr[0];
        for (int i = 0; i < tempArr.length; i++) { 
   
            if (tempArr[i] > max) { 
   
                max = tempArr[i];
            }
            if (tempArr[i] < min) { 
   
                min = tempArr[i];
            }
        }
        // 规范化
        for (int i = 0; i < tempArr.length; i++) { 
   
            tempArr[i] = (tempArr[i] - min) / (max - min);
        }
        return tempArr;
    }


    /** * Z-score规范化 * @param arr * @return 规范化后的数组 */
    public static double[] zScoreNormalize(double[] arr) { 
   
        // 拷贝数组
        double[] tempArr = Arrays.copyOf(arr, arr.length);
        // 求均值
        double sum = 0;
        for (double num : tempArr) { 
   
            sum += num;
        }
        double mean = sum / tempArr.length;
        // 求标准差
        double sum2 = 0;
        for (int i = 0; i < tempArr.length; i++) { 
   
            sum2 += Math.sqrt((tempArr[i] - mean) * (tempArr[i] - mean));
        }
        double standardDivition = sum2 / (tempArr.length - 1);
        // 标准化
        for (int i = 0; i < tempArr.length; i++) { 
   
            tempArr[i] = (tempArr[i] - mean) / standardDivition;
        }
        return tempArr;

    }

    /** * 小数定标规范化 * @param arr * @return 规范化后的数组 */
    public static double[] decimalsNormalize(double[] arr){ 
   
        // 拷贝数组
        double[] tempArr = Arrays.copyOf(arr, arr.length);
        // 找到最大值
        double max = tempArr[0];
        for (int i = 0; i < tempArr.length; i++) { 
   
            if (tempArr[i] > max) { 
   
                max = tempArr[i];
            }
        }
        // 确定j的值(j为使max(|v'|)<1的最小整数)
        int j = 0;
        while (Math.abs(max/Math.pow(10,j))>=1){ 
   
            j++;
        }
        // 规范化
        for (int i = 0; i < tempArr.length; i++) { 
   
            tempArr[i] = tempArr[i] / Math.pow(10,j);
        }
        return tempArr;

    }


}
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106595.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 腾讯云服务器配置ssl,腾讯云服务器SSL证书申请及配置[通俗易懂]

    腾讯云服务器配置ssl,腾讯云服务器SSL证书申请及配置[通俗易懂]最近在研究微信小程序,服务端需要部署在一台服务器上,查看了一下,腾讯云在搞活动,就申请了腾讯云的服务器,但是微信小程序访问需要用https协议才能请求,于是研究了一下如何申请及配置ssl证书。本人穷逼一枚,一向以节俭,所以申请了一个免费证书。申请步骤如下:1、登录证书申请页面https://console.qcloud.com/ssl/apply2、输入必要信息,通用名称及申请邮箱,点击下一步这一…

    2022年9月4日
    4
  • 最新最全的微信小程序入门学习教程,微信小程序零基础入门到精通

    最新最全的微信小程序入门学习教程,微信小程序零基础入门到精通从今天开始就来带领大家学习微信小程序了,只要你跟着我一步步来,相信你也可以上线一款属于自己的微信小程序一,认识小程序微信⼩程序,简称⼩程序,英⽂名MiniProgramMiniProgram,是⼀种不需要下载安装即可使⽤的应⽤,它实现了应⽤“触⼿可及”的梦想,⽤⼾扫⼀扫或搜⼀下即可打开应⽤1-1,微信小程序的优势1.微信有海量⽤⼾,⽽且粘性很⾼,在微信⾥开发产品更容易触达⽤⼾;2.推⼴app或公众号的成本太⾼。3.开发适配成本低。4.容易⼩规模试错,然后快速迭代。5.跨平台。

    2022年6月25日
    48
  • Java sdk安装及配置[通俗易懂]

    Java sdk安装及配置[通俗易懂]1.安装JavaSDK开发环境。首先去官网下载JavaSDK,http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html,下载完成之后,开始安装。点击下一步,安装完成。2.配置JavaSDK环境变量单击“计算机-属性-高级系统设置”,单击“环境变

    2022年7月9日
    20
  • 组合数常用计算公式

    组合数常用计算公式Cnm=n!m!∗(n−m)!C_n^m=\frac{n!}{m!*(n-m)!}Cnm​=m!∗(n−m)!n!​Cn2=n∗(n−1)2C_n^2=\frac{n*(n-1)}{2}Cn2​=2n∗(n−1)​Cn3=n∗(n−1)∗(n−2)6C_n^3=\frac{n*(n-1)*(n-2)}{6}Cn3​=6n∗(n−1)∗(n−2)​Cnm=Cn−1m−1+Cn−1mC_n^m…

    2022年7月25日
    7
  • 操作系统概念(Operating System Concepts Ninth Edition恐龙书)阅读

    操作系统概念(Operating System Concepts Ninth Edition恐龙书)阅读我最近在读一本操作系统的书(操作系统概念OperatingSystemConceptsNinthEdition),这本书是学习操作系统非常不错的书,只要学习过计算机组成原理、计算机体系结构、微机原理等课程就很容易读下去,虽然大多数是概念,不过课后也有编程实战题目,因此可以对操作系统有很好的把控。因此推荐给大家。大家如果看完,可以进一步看看Unix内核编程、现代操作系统的书。…

    2022年7月14日
    13
  • python支持向量机回归_支持向量机——核函数与支持向量回归(附Python代码)[通俗易懂]

    python支持向量机回归_支持向量机——核函数与支持向量回归(附Python代码)[通俗易懂]上期跟大家介绍了支持向量机的一般原理,今天继续跟大家聊聊支持向量机——核函数与支持项链回归。1核函数数据通过某种变换,使原本二维的问题通过某种函数转换到高维的特征空间,而这个函数就称为核函数。核函数有很多种,有线性核函数,多项式核函数,高斯核函数等,其中高斯核函数最为著名。核函数可以说是支持向量机的灵魂,因为现实生活中,我们不大可能通过一个线性的等式就可以完美的解决一个分类问题,总是要经过核函数…

    2022年6月5日
    34

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号