前のページ|次のページ

テキストプロファイルノードについて

テキストプロファイルノード
テキストプロファイルノードを使用すると、ドキュメント内で見つかった語を使ったターゲット変数のプロファイリングが行えます。ターゲット変数のレベルごとに、同ノードは、そのレベルを特徴付け記述するコレクションに含まれている語のリストを出力します。
このアプローチは、TMBeliefプロシジャを使用する階層ベイズモデルを使用して、当該レベルを記述するのに最もふさわしい語は何であるかを予測します。最も一般的な語を単に選択するのを防ぐために、事前の確率を使用して、ターゲット変数の2つ以上のレベルで共通する語には低い重みが付けられます。二値ターゲット変数の場合、2ウェイ比較を使用することで、語の選択を強化しています。名義尺度変数の場合、nウェイ比較が使用されます。順序尺度および時間変数(内部的に順序尺度へと変換される)の場合、シーケンシャルな2ウェイ比較が実施されます。これは、レベルnで報告された語が、レベルn-1で報告された語と比較されることを意味します。例外は最初のレベルであり、この場合、比較するための先行レベルが存在しないため、レベル2と比較されます。
変数タイプのあらゆるケースにおいて、コーパスレベルのプロファイル出力も提供されます。これは、コレクション全体で最良の記述語として解釈されます。
テキストプロファイルノードに関する詳細は、SAS Text Minerのヘルプを参照してください。
この章の残りの部分では、テキストプロファイルノードの使用例を紹介します。
前のページ|次のページ|ページの先頭へ