SAS Text Minerは、SAS Enterprise Miner環境向けのプラグインです。SAS Enterprise Minerは、テキストマイニングの予測的な側面を促進するデータマイニングツールの豊富なセットを提供します。SAS
Text MinerをSAS Enterprise Miner内部に統合することにより、原文データを従来型のデータマイニング変数と結合できるようになります。これにより、テキストマイニングノードをSAS
Enterprise Minerのプロセスフローダイアグラム内に埋め込むことが可能となります。SAS Text Minerは、ローカルデータ、SASデータセット内のオブザベーションとしてのテキスト、外部データベース、Web上のファイルなど、原文データから構成される各種のソースをサポートしています。
SAS Text Miner 13.2には、テキストマイニング分析で使用できる次のノードが含まれています。
SAS Text Minerの各種ノードに関する詳細は、本書の対応する章を参照するか、またはSAS Text Minerのヘルプをご覧ください。
また、Text Minerノードは、テキストマイニングの解析や調査、予測マイニングのためのデータ準備、他のSAS Enterprise Minerノードを使用する場合のより詳細な調査などもサポートします。ユーザーは構造化されたテキスト情報を分析できるほか、Text
Minerノードの構造化された出力を、必要に応じてその他の構造化データと組み合わせることができます。Text Minerノードは高度なカスタマイズが可能であり、ユーザーはさまざまなオプションから選択できます。たとえば、テキスト解析ノードを使用すると、ドキュメントを解析することで、コレクション内の語、フレーズ、およびその他のエンティティに関する詳細な情報を取得できます。テキストクラスタノードを使用すると、ドキュメントを意味のあるグループへとクラスタリングし、そのクラスタに関して検出したコンセプトを報告できます。また、語やドキュメントの並べ替え、検索、フィルタリング(サブセット化)、類似語の検出などの機能により、調査手順を強化できます。
さらに、SAS Text Minerでは、%TMFILTERという名前のSASマクロを使用できます。このマクロを使用すると、テキストの前処理ステップを実施できるほか、お使いのファイルシステムやWebページ上に存在するドキュメントからSASデータセットを作成できます。これらのドキュメントは、多数のベンダー固有フォーマットで存在しています。
SAS Text Minerは柔軟なツールであり、さまざまな問題を解決できます。SAS Text Minerを使用して実行可能なタスクの例を次に示します。
-
-
ドキュメントを事前定義されたカテゴリーにトピック別に分類すること
-
-
-
-
-
ビジネスに関するニュース発表から株式相場を予測すること
-
-
コールセンターのログに基づいてコストを予測すること