机器学习:逻辑回归_混淆矩阵

机器学习,逻辑回归,混淆矩阵。逻辑回归处理分类问题,线性回归的评估方法往往是以准确率为依据,但分类问题在不同业务场景下并不能以准确率为评估标准。

混淆矩阵指标:

真正例(TP,True Positive),真预测为真。

伪反例(FN,False Negative),真预测为假。

真反例(TN,True Negative),假预测为假。

伪正例(FP,False Positive),假预测为真。


例子:癌症样本10个,6个恶性,4个良性,恶性为真。

模型1预测结果:恶性3个正确,良性4个正确。

TP = 3

FN = 6 - 3 = 3

TN = 4

FP = 4 - 4 = 0

精确率 = 3 / (3 + 0) = 1.0

召回率 = 3 / (3 + 3) = 0.5

模型2预测结果:恶性6个正确,良性1个正确。

TP = 6

FN = 6 - 6 = 0

TN = 1

FP = 4 -1 = 3

准确率 = 6  / (6 + 3)  = 0.7

召回率 = 6 / (6 + 0) = 1.0

结果:两种模型精确率模型1比模型2高,但模型2召回率高于模型1,在健康检查的目的下选择模型2。


混淆矩阵

精确率、召回率、F1