データの解析

テキスト解析ノードを使用すると、ドキュメント群を解析し、そこに含まれている語に関する情報を定量化できます。テキスト解析ノードは、eメールメッセージ、ニュース記事、Webページ、研究報告書、調査報告書などの膨大な原文データに対して使用できます。テキスト解析ノードに関する詳細は、SAS Text Minerのヘルプを参照してください。

テキスト解析ノードを分析に追加するには、次の操作を実行します。

ノードツールバー上でテキストマイニングタブを選択し、テキスト解析ノードをダイアグラムワークスペースへとドラッグします。
データ分割ノードをテキスト解析ノードに接続します。
テキスト解析ノードを選択します。

テキスト解析ノードのプロパティがプロパティパネルに表示されます。
品詞を区別するプロパティの値をNoに設定します。

VAERSデータの場合、この設定を行うと、よりコンパクトなサイズの語の集合が提供されます。
類義語プロパティのをクリックします。

ダイアログボックスが表示されます。
テーブルの交換をクリックします。

SASテーブルの選択ダイアログボックスが表示されます。
データセットを指定しないを選択します。
OKをクリックして、SASテーブルの選択ダイアログボックスを終了します。
確認ダイアログボックスではいを選択します。
OKをクリックして、類義語ダイアログボックスを終了します。
品詞を無視するプロパティのをクリックします。

品詞を無視するダイアログボックスが表示されます。
品詞を表す次の項目を選択します。
- Aux
- Conj
- Det
- Interj
- Part
- Prep
- Pron
- Num
注: 複数の項目を選択する場合、CTRLキーを押しながら選択します。

品詞を無視するダイアログボックスで選択された品詞を含む語は、解析時に無視されます。ここに示す選択では、分析において前置詞や限定子のような「低含有量」の語が確実に無視されます。
OKをクリックします。