机器学习,逻辑回归,混淆矩阵。逻辑回归处理分类问题,线性回归的评估方法往往是以准确率为依据,但分类问题在不同业务场景下并不能以准确率为评估标准。
混淆矩阵指标:
真正例(TP,True Positive),真预测为真。
伪反例(FN,False Negative),真预测为假。
真反例(TN,True Negative),假预测为假。
伪正例(FP,False Positive),假预测为真。
例子:癌症样本10个,6个恶性,4个良性,恶性为真。
模型1预测结果:恶性3个正确,良性4个正确。
TP = 3
FN = 6 - 3 = 3
TN = 4
FP = 4 - 4 = 0
精确率 = 3 / (3 + 0) = 1.0
召回率 = 3 / (3 + 3) = 0.5
模型2预测结果:恶性6个正确,良性1个正确。
TP = 6
FN = 6 - 6 = 0
TN = 1
FP = 4 -1 = 3
准确率 = 6 / (6 + 3) = 0.7
召回率 = 6 / (6 + 0) = 1.0
结果:两种模型精确率模型1比模型2高,但模型2召回率高于模型1,在健康检查的目的下选择模型2。
混淆矩阵