Show
纠正下,精确率(precision)和准确率(accuracy)是不一样的,题主问的应该是精确率与召回率之间的差别。 一.定义辨析 刚开始接触这两个概念的时候总搞混,时间一长就记不清了。 实际上非常简单,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是 其实就是分母不同,一个分母是预测为正的样本数,另一个是原来样本中所有的正样本数。 在信息检索领域,精确率和召回率又被称为查准率和查全率, 查准率=检索出的相关信息量 / 检索出的信息总量 查全率=检索出的相关信息量 / 系统中的相关信息总量 二.举个栗子 假设我们手上有60个正样本,40个负样本,我们要找出所有的正样本,系统查找出50个,其中只有40个是真正的正样本,计算上述各指标。
准确率(accuracy) = 预测对的/所有 = (TP+TN)/(TP+FN+FP+TN) = 70% 精确率(precision) = TP/(TP+FP) = 80% 召回率(recall) = TP/(TP+FN) = 2/3 除此之外,还有ROC曲线,PR曲线,AUC等评价指标,可以参见我的博客: 机器学习性能评估指标
这篇文章讲的挺简单的,很容易理解,链接: 推荐系统评测指标
推荐系统中的召回率与准确率版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 欢迎关注本人: 推荐系统公众号:Tiany_RecoSystem 知乎主页:https://www.zhihu.com/people/shen-xiao-ming-77 准确率,顾名思义,就是准确程度。通过正确数/总数得到。而正确数是什么,总数是什么呢? 召回率,我们可以理解为找到的数目与总的需要我们找到的数目的比,那在推荐系统中,什么是找到的数目,什么是需要我们总的找到的数目呢? 令R(u)表示在根据训练数据给用户做出的推荐列表,T(u)表示用户根据测试数据给用户做出的推荐列表,则 召回率: 准确率:
精确率是针对我们 预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本,例如我们给用户推荐了100条新闻,其中10条用户产生了点击,那么准确率为10/100 = 0.1 其实就是分母不同,一个分母是预测为正的样本数,另一个是原来样本中所有的正样本数。但分子都是表示预测的正样本与原来正样本的交集。 在信息检索领域,精确率和召回率又被称为 查准率 和 查全率 ,
查准率 =检索出的相关信息量 / 检索出的信息总量 那年聪聪 于 2021-12-05 11:05:29 发布 20715 收藏 61精确率—查准率——precision:你认为的该类样本,有多少猜对了(猜的准确率如何)召回率—查全率—recall:该类样本有多少被找出来(召回了多少); 准确率—accuracy:正类和负类预测准确的比例。首先明确一下几个表示: -True Positive(真正, TP):将正类预测为正类数. -True Negative(真负, TN):将负类预测为负类数. -False Positive(假正, FP):将负类预测为正类数 →→ 误报 (Type I error). -False Negative(假负, FN):将正类预测为负类数 →→ 漏报 (Type II error).精确率:precision = TP / (TP + FP)召回率:recall = TP / (TP + FN)准确率:accuracy = (TP + TN) / (TP+ FP + TN + FN)F1 Score:F1 Score = P*R/2(P+R),其中P和R分别为 precision 和 recall精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。其实就是分母不同,一个分母是预测为正的样本数,另一个是原来样本中所有的正样本数。例子:假设我们手上有60个正样本,40个负样本,我们要找出所有的正样本,系统查找出50个,其中只有40个是真正的正样本,计算上述各指标。 TP: 将正类预测为正类数 40 FN: 将正类预测为负类数 20 FP: 将负类预测为正类数 10 TN: 将负类预测为负类数 30
参考:(已修改原文中错误)准确率(accuracy)、精确率(precision)、召回率(recall)_Cheese_pop的博客-CSDN博客_精确率和召回率公式 |