A = T P + T N P + N A=\frac{TP + TN} { P + N} A=P+NTP+TN 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比
精确率(precision)P = T P T P + F P P = \frac{TP}{TP+FP} P=TP+FPTP 计算的是所有"正确被检索的item(TP)"占所有"实际被检索到的(TP+FP)"的比例
预测为正的样本中有多少是真正的正样本,它是针对我们预测结果而言的
Precision又称为查准率
召回率(recall)R = T P T P + F N R = \frac{TP}{TP+FN} R=TP+FNTP 计算的是所有"正确被检索的item(TP)"占所有"应该检索到的item(TP+FN)"的比例
样本中的正例有多少被预测正确了, 它是针对我们原来的样本而言的
Recall又称为查全率
F1-measure值就是精确值和召回率的调和均值
2 F 1 = 1 P + 1 R \frac{2}{F_1} = \frac{1}{P} + \frac{1}{R} F12=P1+R1
调整下也就是
F 1 = 2 P R P + R = 2 T P 2 T P + F P + F N F_1 = \frac{2PR}{P+R} = \frac{2TP}{2TP + FP + FN} F1=P+R2PR=2TP+FP+FN2TP
将F-measure一般化
F a = ( a 2 + 1 ) P R a 2 ( P + R ) F_a = \frac{(a^2 + 1 )PR}{a^2(P+R)} Fa=a2(P+R)(a2+1)PR
当 a = 1 a = 1 a=1 时, F 1 = F a F_1 = F_a F1=Fa
F1-measure认为精确率和召回率的权重是一样的,但有些场景下,我们可能认为精确率会更加重要,调整参数a,使用Fa-measure可以帮助我们更好的evaluate结果.
总结准确率就是找得对,召回率就是找得全
参考:
- 准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure
- 准确率(Precision)、召回率(Recall)以及综合评价指标(F1-Measure )