データ分割ノードを使用すると、入力データを次のデータセットのいずれかに分割できます。
-
学習(Training) — 事前のモデルの当てはめに使用されます。分析は、このデータセットを使用して最適なモデルの重みを見つけようとします。
-
検証(Validation) — モデル比較ノードでのモデルの適合性評価に使用されます。検証データセットは、デシジョンツリーモデルノードで最適なサブツリーを作成するためのモデルの微調整にも使用されます。
-
テスト(Test) — モデルの生成エラーに関する最終的な偏りのない評価を取得するために使用されます。
データ分割ノードに関する詳細は、SAS Enterprise Minerのヘルプを参照してください。
データ分割ノードを分析に追加するには、次の操作を実行します。
-
ノードツールバー上で
サンプルタブを選択し、
データ分割ノードをダイアグラムワークスペースへとドラッグします。
-
VAEREXT_SERIOUS入力データノードを
データ分割ノードに接続します。
注: デフォルトの水平ビューで、あるノードを別のノードに接続するには、マウスポインタをノードの右端に置きます。鉛筆アイコンが表示されます。左マウスボタンを押したまま、接続したいノードの左端にまで行をドラッグした後、左マウスボタンを離します。接続されたノードのビューを垂直ビューに変更するには、ダイアグラムワークスペースで右クリックし、表示されたメニューから
レイアウト垂直を選択します。
-
データ分割ノードを選択し、そのプロパティを表示します。
当該ノードに関する詳細情報がプロパティパネルに表示されます。
-
データセット割り当てプロパティを次のように設定します。
-
Trainingプロパティを60.0に設定します。
-
Validationプロパティを20.0に設定します。
-
これらのデータ分割設定を行うことで、VAEREXT_SERIOUSデータを使用して予測モデルを構築する場合に適切なデータを確保できます。