从工具栏中,点击
图标以创建决策树。从
数据窗格中,将
死亡年龄变量拖放到右窗格中的
响应字段中。在
数据窗格中,选择
舒张压、
体重、
身高、
胆固醇、
诊断冠心病的年龄、
性别和
死因。将这些项拖放到模型窗格中。决策树将自动更新。
点击模型窗格右上方的
图标。在详细信息表中,选择
节点规则选项卡。请注意,仅使用了
诊断冠心病的年龄和
死因这两个预测值。您可以调整决策树属性以在模型中包括更多预测值。
点击右窗格中的属性选项卡。最突出的待更改属性是重用预测值。取消选择此属性时,每个预测值变量最多在一次拆分中使用。但是,本示例假定重用预测值将在每个节点中创建最佳拆分。这种情况可能并非始终适用于您的数据。
在这种情况下,请将最大级别数的值设置为 10
。决策树现在的最大深度是 10 个级别,而不是默认的 6 个级别。在详细信息表的节点规则选项卡上,每个预测值至少使用一次。
将最大分支数的值设置为 4
。这样可以使每个非叶节点拆分成最多四个新节点。
要查看
树概览窗口,请点击探索工作区右上角的
图标。在
树概览窗口中,点击
图标以将整个决策树填满
树概览窗口。
在树概览窗口中,右击并选择派生叶 ID 变量。此变量的默认名称为叶 ID (1)。在新建计算项窗口中,点击确定。叶 ID (1) 变量随即显示在数据窗格中。
保存项目。