データのクラスタリング

テキストクラスタノードは、ドキュメントをクラスタリングすることで、特定の記述語に関するドキュメントやレポートの互いに疎な集合を作成します。次の2つのアルゴリズムが利用できます。期待値最大化アルゴリズムは、フラット表示を使用してドキュメントをクラスタリングします。一方、階層クラスタリングアルゴリズムは、クラスタをツリー階層へとグループ化します。両アプローチとも特異値分解(SVD)を使用して、元の重み付きの語/ドキュメントの頻度マトリックスを、高密度ではあるが低次元の表現へと変換します。テキストクラスタノードに関する詳細は、SAS Text Minerのヘルプを参照してください。

データをクラスタリングするには、次の操作を実行します。

ノードツールバー上でテキストマイニングタブを選択し、テキストクラスタノードをダイアグラムワークスペースへとドラッグします。
テキストフィルタノードをテキストクラスタノードに接続します。
テキストクラスタノードを選択します。
記述語を12に設定し、クラスタのラベリングを許可します。
ダイアグラムワークスペース内にあるテキストクラスタノードを右クリックし、実行を選択します。
パスを実行するかどうかを尋ねられたら、確認ダイアログボックスではいをクリックします。
テキストクラスタノードの実行完了後に表示される実行ステータスダイアログボックス内でOKをクリックします。