上一页|下一页

使用决策树

关于决策树

注: 若 SAS Visual Statistics 在您的站点已获许可,则决策树包含高级功能。请参见决策树
决策树使用一个或多个预测值数据项的值来预测响应数据项的值。决策树将一系列节点显示为树,其中顶部节点是响应数据项,树的每个分支代表预测值数据项的值中的一个拆分。决策树也称为分类和回归树。
决策树示例
决策树示例
树的每个分支显示位于拆分顶部的分支的预测值名称。分支的粗细指示与每个节点关联的值数。每个节点的预测值显示在该节点上方。
树中的每个节点将节点数据显示为直方图(若响应包含连续数据)或条形图(若响应包含离散数据)。每个节点中的直方图或条形图显示树中拆分所选择的响应数据项的值。节点右上方的数字指示条形图或直方图的最大值或频数。在每个节点底部,显示该节点的数据值总数(计数)。
在决策树下,将显示节点的冰柱图。冰柱图中节点的颜色表示节点的预测水平。在决策树或冰柱图中选择节点时,将在其他位置选择对应的节点。
SAS Visual Analytics 中的决策树使用 C4.5 算法的修改版本。
决策树的详细信息表包含两个额外数据列:“节点 ID”和“父级 ID”。“节点 ID”指定树中每个节点的唯一值。“父级 ID”指定父节点的 ID。

决策树的数据角色

决策树的基本数据角色包括:
响应
指定决策树的响应。您可以指定任意类别或测度。决策树尝试预测响应数据项的值。树的每个节点内的条形图或直方图显示响应数据项值的频数。
预测值
指定决策树的预测值。您可以将一个或多个类别或测度指定为预测值。预测值数据项的值显示在树中的节点上方。预测值列表中的数据项顺序不影响树。
注: 若预测值对树的预测准确度没有贡献,或已修剪贡献,则预测值不包含在显示的最终树中。

指定决策树的属性

属性选项卡上,您可以指定以下选项:
名称
指定可视化视图的名称。
包括缺失值
指定树中是否包括缺失值。
频数
指定每个节点的频数值显示为计数(计数)还是百分比(百分比)。
注: 频数值基于在可视化视图中显示的数据(在应用过滤器和其他数据选择项之后)。
生长策略
指定用于创建决策树的参数。选择以下值之一:
基本
指定一个简单的树,其中每个拆分最多两个分支,最多包含六个级别。有关详细信息,请参见基本和高级生长策略的参数值
高级
指定一个复杂的树,其中每个拆分最多四个分支,最多包含六个级别。有关详细信息,请参见基本和高级生长策略的参数值
自定义
允许您为每个参数选择值。
若您选择自定义作为生长策略的值,则显示以下附加选项:
最大分支数
指定每个节点拆分的最大分支数。
最大级别数
指定树中的最大级别数。
叶大小
指定每个节点的最小值数(计数)。
响应箱
指定用于响应数据项的箱数。
注: 若响应数据项包含离散数据,则该选项不起作用。
预测值箱数
指定用于预测值数据项的箱数。
注: 若预测值数据项包含离散数据,则该选项不起作用。
快速生长
使您可以为决策树生长使用信息增益比和 k 均值快速搜索方法。禁用后,将使用信息增益和贪婪搜索方法,这通常会生成更大的树,并且需要更多时间进行创建。
修剪
指定应用到树的修剪级别。修剪将删除对树的预测准确度影响最小的叶和分支。更宽松的修剪值指定从树中删除更少的叶和分支。更严格的修剪值指定从树中删除更多的叶和分支。
重用预测值
指定预测值可以在树中多次使用。
以下参数值用于基本高级生长策略:
基本和高级生长策略的参数值
属性
基本值
高级值
最大分支数
2
4
最大级别数
6
6
叶大小
1
1
响应箱
10
10
预测值箱数
2
10
重用预测值
No

将节点作为新可视化视图探索

对于树中的每个节点,您可以将数据值作为新的直方图或条形图可视化视图探索。要创建节点的新可视化视图,请右击该节点,然后选择从节点创建可视化视图。将显示新可视化视图。
注: 若您从显示直方图的节点创建可视化视图,则新直方图可能与决策树中显示的直方图有明显差异。例如,X 轴上的箱数和数据范围可能不同。但是,两个直方图使用的数据完全相同。

从决策树派生叶 ID 数据项

您可以派生叶 ID 数据项来表示决策树的结果。该叶 ID 数据项创建与决策树详细信息表中的节点 ID 对应的值。
您可以在过滤器中使用叶 ID 数据项来选择其他类型的可视化视图中决策树节点的值。
要从决策树计算叶 ID 数据项,请执行下列操作:
  1. 从可视化视图工具栏选择 选项 下拉列表,然后选择派生叶 ID 变量
  2. 新建计算项窗口中,输入新计算项的名称
  3. 点击确定以创建新的数据项。

显示概览

对于大的决策树,通过概览,您可以选择可见的树部分。
要显示概览,请右击决策树中的空白部分,然后选择显示概览
注: 概览中的每个叶节点都会显示一个直条,指示该节点中的最大值。要为概览中的每个节点显示一个直条,请右击决策树中的空白部分,然后选择显示分支颜色

缩放决策树

您可以使用以下控件之一缩放决策树:
  • 在概览中,选择要查看的决策树部分
  • 在可视化视图上滚动鼠标滚轮以在光标位置放大或缩小
注: 若您缩小了决策树,则每个节点为该节点中的最大值显示一个直条。要为树中的每个节点显示一个直条,请右击决策树中的空白部分,然后选择显示分支颜色
在放大决策树并随之显示滚动条之后,通过同时按下 Shift 和 Alt 键并拖动该决策树可以调整该决策树的位置。

平移(滚动)决策树

您可以使用以下任意控件来平移(滚动)决策树:
  • 在概览中,拖动选择框
  • 按住 Shift 键并拖动决策树
上一页|下一页|页首