前のページ|次のページ

テキストマイニング処理

記述または予測(あるいはその両方)を目的として原文データの使用を意図しているかどうかにかかわらず、次の表に示すように同じ処理手順が実行されます。
アクション
結果
ツール
ファイルの前処理
お手持ちのドキュメントコレクションから単一のSASデータセットを作成します。このSASデータセットは、テキスト解析ノードで入力として使用されるほか、実際のテキストまたは実際のテキストへのパスを含む場合もあります。
テキストインポートノード
%TMFILTERマクロ — ドキュメントからテキストを抽出し、テキスト変数を含む事前定義済みのSASデータセットを作成するSASマクロです。
テキスト解析
原文データを分解し、データマイニング用に適した定量的表現を生成します。
テキスト解析ノード
変換(次元縮小)
定量的表現をコンパクトで情報的な形式に変換します。
テキストフィルタノード
ドキュメント分析
ドキュメントコレクションに関して、分類、予測、コンセプトのリンク付けを実施します。データからクラスタ、トピック、ルールを作成します。
テキストクラスタノード
テキストトピックノード
テキストルールビルダノード
テキストプロファイルノード
SAS Enterprise Minerの予測モデリングノード
注: Text Minerノードは、SAS Text Miner 13.2のテキストマイニングタブからは使用できません。Text Minerノードは、他のSAS Text Miner ノードでの機能により置き換えられています。プロセスフローダイアグラム内にText Minerノードが存在していた以前のリリースのSAS Text Minerからダイアグラムをインポートできます。ただし、新しいText Minerノードは作成できず、インポートしたText Minerノードのプロパティ値を変えることもできません。詳細については、SAS Text Minerヘルプの「以前のバージョンに含まれていたSAS Text Minerダイアグラムの変換」というトピックを参照してください。
最後に、クラスタリングや予測に関するルールを使用して、新しいドキュメントコレクションを任意の時点でスコアリングします。
これらの手順のすべてを分析に含める必要はありません。満足する結果を得るためには、オプションのさまざまな組み合わせを試す必要があります。
前のページ|次のページ|ページの先頭へ