テキスト解析ノードを使用すると、ドキュメント群を解析し、そこに含まれている語に関する情報を定量化できます。テキスト解析ノードは、eメールメッセージ、ニュース記事、Webページ、研究報告書、調査報告書などの膨大な原文データに対して使用できます。テキスト解析ノードに関する詳細は、SAS Text Minerのヘルプを参照してください。
テキスト解析ノードを分析に追加するには、次の操作を実行します。
-
ノードツールバー上で
テキストマイニングタブを選択し、
テキスト解析ノードをダイアグラムワークスペースへとドラッグします。
-
データ分割ノードを
テキスト解析ノードに接続します。
-
テキスト解析ノードのプロパティがプロパティパネルに表示されます。
-
VAERSデータの場合、この設定を行うと、よりコンパクトなサイズの語の集合が提供されます。
-
類義語プロパティの
をクリックします。
ダイアログボックスが表示されます。
-
SASテーブルの選択ダイアログボックスが表示されます。
-
-
OKをクリックして、
SASテーブルの選択ダイアログボックスを終了します。
-
-
OKをクリックして、
類義語ダイアログボックスを終了します。
-
品詞を無視するプロパティの
をクリックします。
品詞を無視するダイアログボックスが表示されます。
-
注: 複数の項目を選択する場合、CTRLキーを押しながら選択します。
品詞を無視するダイアログボックスで選択された品詞を含む語は、解析時に無視されます。ここに示す選択では、分析において前置詞や限定子のような「低含有量」の語が確実に無視されます。
-