前のページ|次のページ

データのフィルタリング

テキストフィルタノードを使用すると、解析済みの語や分析対象となるドキュメントの総数を減らすことができます。これにより、無関係な情報を取り除き、最も価値の高い関連性のある情報だけを検討対象とすることができます。たとえば、テキストフィルタノードを使用することで、不要な語を削除し、特定の問題について記述しているドキュメントだけを保持することができます。このような縮小されたデータセットは、数十万のドキュメントや数十万の語を含んでいるオリジナルの集合を表すデータセットよりも桁違いにサイズが小さくなります。テキストフィルタノードに関する詳細は、SAS Text Minerのヘルプを参照してください。
データをフィルタリングするには、次の操作を実行します。
  1. ノードツールバー上でテキストマイニングタブを選択し、テキストフィルタノードをダイアグラムワークスペースへとドラッグします。
  2. テキスト解析ノードをテキストフィルタノードに接続します。
    プロセスフローダイアグラム
  3. テキストフィルタノードを選択します。
  4. 語の重みプロパティの値を相互統計量に設定します。
    これにより、語が重篤な反応に対応する場合に、その語に対する重み付けが変化するようになります。
前のページ|次のページ|ページの先頭へ