前のページ|次のページ

データのクラスタリング

テキストクラスタノードは、ドキュメントをクラスタリングすることで、特定の記述語に関するドキュメントやレポートの互いに疎な集合を作成します。次の2つのアルゴリズムが利用できます。期待値最大化アルゴリズムは、フラット表示を使用してドキュメントをクラスタリングします。一方、階層クラスタリングアルゴリズムは、クラスタをツリー階層へとグループ化します。両アプローチとも特異値分解(SVD)を使用して、元の重み付きの語/ドキュメントの頻度マトリックスを、高密度ではあるが低次元の表現へと変換します。テキストクラスタノードに関する詳細は、SAS Text Minerのヘルプを参照してください。
データをクラスタリングするには、次の操作を実行します。
  1. ノードツールバー上でテキストマイニングタブを選択し、テキストクラスタノードをダイアグラムワークスペースへとドラッグします。
  2. テキストフィルタノードをテキストクラスタノードに接続します。
    プロセスフローダイアグラム
  3. テキストクラスタノードを選択します。
  4. 記述語12に設定し、クラスタのラベリングを許可します。
  5. ダイアグラムワークスペース内にあるテキストクラスタノードを右クリックし、実行を選択します。
  6. パスを実行するかどうかを尋ねられたら、確認ダイアログボックスではいをクリックします。
  7. テキストクラスタノードの実行完了後に表示される実行ステータスダイアログボックス内でOKをクリックします。
前のページ|次のページ|ページの先頭へ