混淆矩阵的假正是指(机器学习基础(一)混淆矩阵,真阳性(TP),真阴性(TN),假阳性(FP),假阴性(FN)以及敏感性(Sensitivity)和特异性(Specificity))
混淆矩阵
混淆矩阵如下图:这里以是否有心脏病举例(二分类举例) ,列代表机器学习算法所做的预测 ,有心脏病还是没有心脏病 ,行代表实际的情况 。
真阳性 ,真阴性 ,假阳性 ,假阴性
真阳性(TP):病人有心脏病 ,且被算法正确的预测出有 。
真阴性(TN):病人无心脏病 ,且被算法正确的预测出无 。
假阴性(FN):病人有心脏病 ,但被算法预测成无 ,将原本的阳性预测成阴性 ,预测错误 ,所以是假阴性 。
假阳性(FP):病人无心脏病,但被算法预测成有 ,将原本的阴性预测成阳性 ,所以是假阳性 。
敏感性,特异性
Sensitivity敏感性(真阳性率 ,True Positive Rate = TPR)是指以所有的真实的阳性为条件 ,预测结果也为阳性的概率 。
公式如下
在这个例子中 ,是指被正确识别带有心脏病人的百分比 。
Specificity特异性(真阴性率 ,True negative Rate = TNR)是指以所有真实的阴性为条件 ,预测结果也为阴性的概率 。
在这个例子中 ,是指正确识别不带有心脏病人的百分比 。
如果识别阳性重要 ,则要选择高敏感性的方法 ,及Sensitivity高 ,预测准确阳性的概率更高 。
如果识别阴性重要 ,则要选择高特异性的方法 ,及Specificity高 ,预测准确阴性的概率更高 。
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!