テキストクラスタノードは、ドキュメントをクラスタリングすることで、特定の記述語に関するドキュメントやレポートの互いに疎な集合を作成します。次の2つのアルゴリズムが利用できます。期待値最大化アルゴリズムは、フラット表示を使用してドキュメントをクラスタリングします。一方、階層クラスタリングアルゴリズムは、クラスタをツリー階層へとグループ化します。両アプローチとも特異値分解(SVD)を使用して、元の重み付きの語/ドキュメントの頻度マトリックスを、高密度ではあるが低次元の表現へと変換します。テキストクラスタノードに関する詳細は、SAS Text Minerのヘルプを参照してください。
データをクラスタリングするには、次の操作を実行します。
-
ノードツールバー上で
テキストマイニングタブを選択し、
テキストクラスタノードをダイアグラムワークスペースへとドラッグします。
-
テキストフィルタノードを
テキストクラスタノードに接続します。
-
-
記述語を
12
に設定し、クラスタのラベリングを許可します。
-
ダイアグラムワークスペース内にある
テキストクラスタノードを右クリックし、
実行を選択します。
-
パスを実行するかどうかを尋ねられたら、
確認ダイアログボックスで
はいをクリックします。
-
テキストクラスタノードの実行完了後に表示される
実行ステータスダイアログボックス内で
OKをクリックします。