前のページ|次のページ

データの解析

テキスト解析ノードを使用すると、ドキュメント群を解析し、そこに含まれている語に関する情報を定量化できます。テキスト解析ノードは、eメールメッセージ、ニュース記事、Webページ、研究報告書、調査報告書などの膨大な原文データに対して使用できます。テキスト解析ノードに関する詳細は、SAS Text Minerのヘルプを参照してください。
テキスト解析ノードを分析に追加するには、次の操作を実行します。
  1. ノードツールバー上でテキストマイニングタブを選択し、テキスト解析ノードをダイアグラムワークスペースへとドラッグします。
  2. データ分割ノードをテキスト解析ノードに接続します。
    プロセスフローダイアグラム
  3. テキスト解析ノードを選択します。
    テキスト解析ノードのプロパティがプロパティパネルに表示されます。
  4. 品詞を区別するプロパティの値をNoに設定します。
    VAERSデータの場合、この設定を行うと、よりコンパクトなサイズの語の集合が提供されます。
  5. 類義語プロパティの省略記号アイコンをクリックします。
    ダイアログボックスが表示されます。
  6. テーブルの交換をクリックします。
    SASテーブルの選択ダイアログボックスが表示されます。
  7. データセットを指定しないを選択します。
  8. OKをクリックして、SASテーブルの選択ダイアログボックスを終了します。
  9. 確認ダイアログボックスではいを選択します。
  10. OKをクリックして、類義語ダイアログボックスを終了します。
  11. 品詞を無視するプロパティの省略記号アイコンをクリックします。
    品詞を無視するダイアログボックスが表示されます。
  12. 品詞を表す次の項目を選択します。
    • Aux
    • Conj
    • Det
    • Interj
    • Part
    • Prep
    • Pron
    • Num
    注: 複数の項目を選択する場合、CTRLキーを押しながら選択します。
    品詞を無視するダイアログボックスで選択された品詞を含む語は、解析時に無視されます。ここに示す選択では、分析において前置詞や限定子のような「低含有量」の語が確実に無視されます。
  13. OKをクリックします。
前のページ|次のページ|ページの先頭へ