前のページ|次のページ

ディシジョンツリーの操作

ディシジョンツリーについて

ディシジョンツリーでは、1つ以上の予測データアイテムの値を使用して、ターゲットデータアイテムの値を予測します。ディシジョンツリーでは、一連のノードをツリーとして表示します。最上位ノードはターゲットのデータアイテムで、ツリーの各枝は予測変数のデータアイテムの値の分割を表しています。ディシジョンツリーは、分類ツリーおよび回帰ツリーとも呼ばれます。
ディシジョンツリーの例
ディシジョンツリーの例
ツリーの各枝には、分割の最上位にある枝の予測変数の名前が表示されます。枝の太さは、各ノードに関連付けられている値の数を表しています。各ノードの予測変数の値はノードの上に表示されます。
ツリーの各ノードには、ヒストグラム(ターゲットが連続データを含む)または棒グラフ(ターゲットが個別値を含む場合)のいずれかとしてノードのデータが表示されます。各ノードのヒストグラムまたは棒グラフには、ツリー内の分割により選択されたターゲットのデータアイテムの値が表示されます。ノードの右上の数字は、棒グラフまたはヒストグラムの最大値または最大度数を示します。各ノードの下部には、同ノードのデータ値(カウント)の合計数が表示されます。
SAS Visual Analyticsのディシジョンツリーは、修正バージョンのC4.5アルゴリズムを使用します。
ディシジョンツリーの詳細テーブルには、ノードIDと親IDの2つのデータ列が含まれます。ノードIDは、ツリー内の各ノードの固有値を指定します。親IDは、親ノードのIDを指定します。

ディシジョンツリーのデータの役割

ディシジョンツリーの基本的なデータの役割は、次のとおりです。
ターゲット
ディシジョンツリーのターゲットを指定します。任意のカテゴリまたはメジャーを指定できます。ディシジョンツリーは、ターゲットのデータアイテムの値を予測しようとします。ツリーの各ノード内の棒グラフまたはヒストグラムには、ターゲットのデータアイテムの度数が表示されます。
予測変数
ディシジョンツリーの予測変数を指定します。1つ以上のカテゴリまたはメジャーを予測変数として指定できます。予測変数のデータアイテムの値は、ツリーのノードの上に表示されます。予測変数リストのデータアイテムの順番は、ツリーに影響しません。
注: 予測変数がツリーの予測精度に効果がない場合、ツリーでは使用されません。

ディシジョンツリーのプロパティの指定

プロパティタブでは、次のオプションを指定できます。
名前
ビジュアルの名前を指定します。
タイトル
グラフの上に表示されるタイトルを指定します。
注: タイトルオプションは、グラフタイトルの自動作成を選択した場合は無効になります。
グラフタイトルの自動作成
グラフタイトルがビジュアル内のデータアイテムに基づいて自動的に生成されるように指定します。
欠損値を含める
ツリーに欠損値を含めるかどうかを指定します。
度数
各ノードの度数値をカウント(カウント)として表示するか、それともパーセント(パーセント)として表示するかを指定します。
注: 度数値は、ビジュアルに表示されている(フィルタおよび他のデータ選択が適用された後の)データに基づきます。
生長の方法
ディシジョンツリーの作成に使用されるパラメータを指定します。次のいずれかの値を選択します。
基本
最大6レベルおよび分割あたり最大2つの枝を持つシンプルなツリーを指定します。詳細は、基本および詳細の成長の方法のパラメータ値を参照してください。
詳細
最大6レベルおよび分割あたり最大4つの枝を持つ複雑なツリーを指定します。詳細は、基本および詳細の成長の方法のパラメータ値を参照してください。
エキスパート
エキスパートパラメータごとに値を選択できます。
エキスパート生長の方法として選択すると、次の追加オプションが表示されます。
最大枝数
ノード分割ごとの枝の最大数を指定します。
最大レベル
ツリーのレベルの最大数を指定します。
葉のサイズ
ノードごとの値(カウント)の最小数を指定します。
ターゲットビン
ターゲットのデータアイテムに使用されるビンの数を指定します。
注: ターゲットのデータアイテムに個別データが含まれていない場合は、このオプションは無効になります。
予測変数ビン
予測変数のデータアイテムに使用されるビンの数を指定します。
注: ターゲットのデータアイテムに予測変数のデータが含まれていない場合は、このオプションは無効になります。
プルーニング
ツリーに適用されるプルーニングのレベルを指定します。プルーニングは、ツリーの予測精度への効果が少ない葉および枝を除去します。より寛容なプルーニング値は、より少ない葉および枝がツリーから削除されることを指定します。より積極的なプルーニング値は、より多くの葉および枝がツリーから削除されることを指定します。
予測子の再利用
予測変数をツリーで2回以上使用することを指定します。
基本および詳細の生長の方法では、次のパラメータ値が使用されます。
基本および詳細の成長の方法のパラメータ値
プロパティ
基本の値
詳細の値
最大枝数
2
4
最大レベル
6
6
葉のサイズ
1
1
ターゲットビン
10
10
予測変数ビン
2
10
予測子の再利用
いいえ
はい

新規ビジュアルとしてのノードの探索

ツリーのノードごとに、データ値を新しいヒストグラムまたは棒グラフのビジュアルとして探索できます。ノードの新規ビジュアルを作成するには、そのノードを右クリックしてノードからビジュアルの作成を選択します。新しいビジュアルが表示されます。
注: ヒストグラムを表示するノードからビジュアルを作成する場合、新しいヒストグラムのビジュアルはディシジョンツリーに表示されるヒストグラムとは異なる場合があります。たとえば、X軸のデータのビンと範囲が異なる場合があります。ただし、2つのヒストグラムはまったく同じデータを使用します。

ディシジョンツリーからのデータアイテムの計算

計算データアイテムを作成して、ディシジョンツリーの結果を示すことができます。計算データアイテムは、ディシジョンツリーの詳細テーブルに表示できるノードIDに対応する値を作成します。
フィルターで計算データアイテムを使用して、別の種類のビジュアルでデシジョンツリーノードの値を選択できます。
ディシジョンツリーからデータアイテムを計算するには、次の操作を行います。
  1. ビジュアルツールバーからオプションドロップダウンリストを選択した後、計算アイテムの作成を選択します。
  2. 新しい計算アイテムウィンドウに、新しい計算アイテムの名前を入力します。
  3. OKをクリックして、新しいアイテムを作成します。

概要の表示

ディシジョンツリーが大きい場合は、概要を使用すると、表示されるツリーの部分を選択できます。
概要を表示するには、ビジュアルツールバーからオプションドロップダウンリストを選択した後、概要の表示を選択します。

ディシジョンツリーの拡大/縮小

次のいずれかのコントロールを使用してディシジョンツリーを拡大/縮小できます。
  • 概要で、表示するディシジョンツリーの部分を選択する
  • ビジュアル上でマウスのホイールをスクロールして、カーソルの位置でズームインまたはズームアウトする
注: ターゲットが離散値を含んでいる場合、デシジョンツリー上でズームアウトすると、各ノードは同ノード内での単一の最大値を表示します。
デシジョンツリー上でズームインを行った結果、スクロールバーが表示された場合、Shift+Altキーを押しながらデシジョンツリーをドラッグすることにより、そのデシジョンツリーを再配置します。

ディシジョンツリーの移動(スクロール)

次のいずれかのコントロールを使用してディシジョンツリーを移動(スクロール)できます。
  • 概要で選択ボックスをドラッグする
  • Shiftキーを押しながらディシジョンツリーをドラッグする
前のページ|次のページ|ページの先頭へ