ディシジョンツリーでは、1つ以上の予測データアイテムの値を使用して、ターゲットデータアイテムの値を予測します。ディシジョンツリーでは、一連のノードをツリーとして表示します。最上位ノードはターゲットのデータアイテムで、ツリーの各枝は予測変数のデータアイテムの値の分割を表しています。ディシジョンツリーは、分類ツリーおよび回帰ツリーとも呼ばれます。
ツリーの各枝には、分割の最上位にある枝の予測変数の名前が表示されます。枝の太さは、各ノードに関連付けられている値の数を表しています。各ノードの予測変数の値はノードの上に表示されます。
ツリーの各ノードには、ヒストグラム(ターゲットが連続データを含む)または棒グラフ(ターゲットが個別値を含む場合)のいずれかとしてノードのデータが表示されます。各ノードのヒストグラムまたは棒グラフには、ツリー内の分割により選択されたターゲットのデータアイテムの値が表示されます。ノードの右上の数字は、棒グラフまたはヒストグラムの最大値または最大度数を示します。各ノードの下部には、同ノードのデータ値(カウント)の合計数が表示されます。
SAS Visual Analyticsのディシジョンツリーは、修正バージョンのC4.5アルゴリズムを使用します。
ディシジョンツリーの詳細テーブルには、ノードIDと親IDの2つのデータ列が含まれます。ノードIDは、ツリー内の各ノードの固有値を指定します。親IDは、親ノードのIDを指定します。