AUC计算公式推导

全栈程序员-站长 • 2026年3月26日下午11:26 • 未分类 • 阅读 2

AUC计算公式推导

基本公式推算

AUC计算公式推导

基本排名的公式推算

2.详解如何计算AUC？

ID	label	pro
A	0	0.1
B	0	0.4
C	1	0.35
D	1	0.8

ID	label	pro
A	0	0.1
B	0	0.4
C	1	0.4
D	1	0.8

ID	label	pro
A	0	0.1
B	0	0.4
C	1	0.35
D	1	0.8

ID	label	pro	rank
A	0	0.1	1
C	1	0.35	2
B	0	0.4	3
D	1	0.8	4

ID	label	pro
A	1	0.8
B	1	0.7
C	0	0.5
D	0	0.5
E	1	0.5
F	1	0.5
G	0	0.3

ID	label	pro	rank
G	0	0.3	1
F	1	0.5	2
E	1	0.5	3
D	0	0.5	4
C	0	0.5	5
B	1	0.7	6
A	1	0.8	7

3.最后的最后，如何用程序验证？

import numpy as np from sklearn.metrics import roc_auc_score y_true = np.array([1, 1, 0, 0, 1, 1, 0]) y_scores = np.array([0.8, 0.7, 0.5, 0.5, 0.5, 0.5, 0.3]) print("y_true is ", y_true) print("y_scores is ", y_scores) print("AUC is", roc_auc_score(y_true, y_scores)) y_true = np.array([0, 0, 1, 1]) y_scores = np.array([0.1, 0.4, 0.35, 0.8]) print("y_true is ", y_true) print("y_scores is ", y_scores) print("AUC is ", roc_auc_score(y_true, y_scores))

模拟实际应用场景：

import pandas as pd import numpy as np def auc(df, label='label', predict='predict', prob=False): """ 功能：根据样本实际标签和预测概率（分数）快速计算auc值。 参数： df: pd.DataFrame,至少包含标签号预测结果列； label: 样本实际标签(0, 1)； predict: 预测结果（分数或概率均可）； prob: predict是否为概率，根据实际情况设置，默认False； 输出：auc值。 """ if prob: df.sort_values(by=predict, ascending=False, inplace=True) else: df.sort_values(by=predict, ascending=True, inplace=True) rank = list(reversed(range(1, df.shape[0] + 1))) df['rank'] = rank mean = df.groupby([predict])['rank'].mean().reset_index() mean.columns = [predict, 'rank_mean'] df = pd.merge(df, mean, on=predict) df[label].value_counts() N, M = df[label].value_counts().sort_index().values formula1 = df[df[label]==1]['rank'].sum() formula2 = M * (M + 1) / 2 return np.round((formula1 - formula2) / (M * N), 4) if __name__ == '__main__': np.random.seed(1234) score = np.round(np.random.normal(600, 100, ).reshape(-1, 1)) temp = np.random.uniform(0, 1, ).reshape(-1, 1) label = score * temp threshold = np.percentile(label, 10) label = np.array([1 if x < threshold else 0 for x in label]).reshape(-1, 1) data = np.concatenate((label, score), axis=1) df = pd.DataFrame(data=data, columns=['label', 'predict']) auc = auc(df=df, label='label', predict='predict') print('测试数据的auc：{}'.format(auc))

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/175781.html原文链接：https://javaforall.net

AUC计算公式推导

AUC计算公式推导

基本公式推算

基本排名的公式推算

2.详解如何计算AUC？

3.最后的最后，如何用程序验证？

关于作者

全栈程序员-站长

发表回复

AUC计算公式推导

AUC计算公式推导

基本公式推算

基本排名的公式推算<img decoding="async" src="http://qn.javajgs.com/20220829/0a3205f1-e4d3-4f1a-b566-e2199ef4454d20220829f28465d9-becb-41f1-a6d1-b2f66313979b1.jpg" title="" alt="AUC计算公式推导" />

2.详解如何计算AUC？

3.最后的最后，如何用程序验证？

关于作者

全栈程序员-站长

相关推荐

jenkins allure_allure的用法

数据结构 || 二维数组按行存储和按列存储[通俗易懂]

html两个div占满一行，设置div背景色，用float浮动并让键值对形式的文字键右对齐，值左对齐

phpstorm2021永久激活码[在线序列号][通俗易懂]

java dump分析工具_java线程dump分析工具

不同维度矩阵相乘[通俗易懂]

发表回复

基本排名的公式推算