前のページ|次のページ

入力データの分割

データ分割ノードを使用すると、入力データを次のデータセットのいずれかに分割できます。
  • 学習(Training) — 事前のモデルの当てはめに使用されます。分析は、このデータセットを使用して最適なモデルの重みを見つけようとします。
  • 検証(Validation) — モデル比較ノードでのモデルの適合性評価に使用されます。検証データセットは、デシジョンツリーモデルノードで最適なサブツリーを作成するためのモデルの微調整にも使用されます。
  • テスト(Test) — モデルの生成エラーに関する最終的な偏りのない評価を取得するために使用されます。
データ分割ノードに関する詳細は、SAS Enterprise Minerのヘルプを参照してください。
データ分割ノードを分析に追加するには、次の操作を実行します。
  1. ノードツールバー上でサンプルタブを選択し、データ分割ノードをダイアグラムワークスペースへとドラッグします。
  2. VAEREXT_SERIOUS入力データノードをデータ分割ノードに接続します。
    注: デフォルトの水平ビューで、あるノードを別のノードに接続するには、マウスポインタをノードの右端に置きます。鉛筆アイコンが表示されます。左マウスボタンを押したまま、接続したいノードの左端にまで行をドラッグした後、左マウスボタンを離します。接続されたノードのビューを垂直ビューに変更するには、ダイアグラムワークスペースで右クリックし、表示されたメニューからレイアウト次に垂直を選択します。
    プロセスフローダイアグラム
  3. データ分割ノードを選択し、そのプロパティを表示します。
    当該ノードに関する詳細情報がプロパティパネルに表示されます。
  4. データセット割り当てプロパティを次のように設定します。
    • Trainingプロパティを60.0に設定します。
    • Validationプロパティを20.0に設定します。
    • Testプロパティを20.0に設定します。
    これらのデータ分割設定を行うことで、VAEREXT_SERIOUSデータを使用して予測モデルを構築する場合に適切なデータを確保できます。
前のページ|次のページ|ページの先頭へ