1.4.2 混淆矩阵
1.4.2 混淆矩阵
混淆矩阵(confusion matrix)是一个将分类问题按照真实情况与判别情况两个维度进行归类的矩阵,在二分类问题中,可以用一个2x2的矩阵表示。如图1-32所示,tp表示实际为真预测为真,tn表示实际为假预测为假,fn表示实际为真预测为假,通俗讲就是漏报了,fp表示实际为假预测为真,通俗讲就是误报了。
图1-32 二分类问题的混淆矩阵
在scikit-learn中,使用metrics.confusion_matrix输出混淆矩阵。
print "confusion_matrix:"
print metrics.confusion_matrix(test_y, pred_y)
输出结果如下,其中漏报36个,误报了25个。
confusion_matrix:
[[70 25]
[36 69]]
混淆矩阵(confusion matrix)是一个将分类问题按照真实情况与判别情况两个维度进行归类的矩阵,在二分类问题中,可以用一个2x2的矩阵表示。如图1-32所示,tp表示实际为真预测为真,tn表示实际为假预测为假,fn表示实际为真预测为假,通俗讲就是漏报了,fp表示实际为假预测为真,通俗讲就是误报了。
图1-32 二分类问题的混淆矩阵
在scikit-learn中,使用metrics.confusion_matrix输出混淆矩阵。
print "confusion_matrix:"
print metrics.confusion_matrix(test_y, pred_y)
输出结果如下,其中漏报36个,误报了25个。
confusion_matrix:
[[70 25]
[36 69]]