上一页|下一页

使用“评估”窗口

关于“评估”窗口

对于决策树,评估窗口可绘制提升度、ROC 和误分类率。使用评估窗口可确定模型与数据的拟合情况。
提升度是在每个百分位数箱中捕获的响应百分比与该模型的平均响应百分比之间的比率。同样,累积提升度使用所有数据(包括当前百分位数箱)进行计算。
接收者操作特征 (ROC) 图显示模型避免误报和漏报分类的能力。误报分类是指观测已确定为事件,而其实际上不是事件(也称为 I 型错误)。漏报分类是指观测已确定为不是事件,而其实际上是事件(也称为 II 型错误)。
误分类图显示为响应变量的每个值正确和错误分类的观测数。当响应变量不是二元型时,Logistic 回归模型将不是事件的所有水平视为相等。大量误分类可能表示您的模型与数据不拟合。

使用“评估”窗口

提升度

默认提升度图显示模型的累积提升度。要查看非累积提升度,请点击垂直轴上的 显示操作 图标,然后选择提升度
为便于比较,提升度图会根据对输入数据的全面了解绘制最佳模型。

ROC

模型的特异度是特异率。要派生误报率,请从 1 中减去特异度。标记为 1 – 特异度的误报率是 ROC 图的 X 轴。模型的灵敏度是命中率。这是 ROC 图的 Y 轴。因此,ROC 图绘制命中率如何随着误报率的变化而变化。
好的 ROC 图具有非常陡的初始斜率并且快速趋平。也就是说,对于观测的每个误分类,对明显更多的观测进行了正确分类。对于没有误报和漏报的完美模型,ROC 图将从 (0,0) 开始,垂直上升到 (0,1),然后水平前进到 (1,1)。在此实例中,模型将在出现任何误分类之前对每个观测进行正确分类。
ROC 图中有两条线,可帮助您解释 ROC 图。第一条线是斜率为 1 的基线模型。这条线模拟的是对观测的正确分类率与错误分类率相同的模型。理想的 ROC 图会最大化基线模型与该 ROC 图之间的距离。错误分类的观测数多于正确分类观测数的模型位于基线模型下方。第二条线是一条表示误报率的垂直线,其中 ROC 图的 Kolmogorov-Smirnov 值与基线模型之间的差异达到最大。

误分类

误分类图显示正确和错误分类的观测数。大量误分类可能表示模型不适合数据。
您的数据中事件与非事件的比率相对较大时,误分类图可能显示大量命中和误报。在此情况下,您的模型将大多数观测预测为事件,并且正确率通常超过五成。

评估

响应箱数量设置为 10 以上时,评估窗口将绘制预测平均值和观测平均值。使用此图确定模型与数据的拟合情况。
评估窗口基于评估属性中指定的值对数据进行分箱。在每个箱处,您可以将鼠标悬停在一条线或两条线上以显示工具提示。
上一页|下一页|页首