前のページ|次のページ

SAS Text Miner

SAS Text Miner 14.2

SAS Text Miner 14.2は、SAS 9.4M4以降のリリースで稼動します。SAS Text Miner 14.2では、ノードの実行および結果の表示時のパフォーマンスが向上しています。また、ハイパフォーマンスHPTMINEプロシジャでは、テキストデータをさらにスウェーデン語でも解析できるようになりました。
SAS Text Miner 14.2の新機能や拡張の詳細については、SAS Text Minerのソフトウェア製品ページを参照してください。

SAS Text Miner 14.1

SAS Text Miner 14.1は、SAS 9.4M3以降のリリースで稼動します。
ここでは、SAS Text Miner 14.1の新機能と拡張の一部を説明します。
  • 新しいHPBOOLRULEプロシジャでテキストルールビルダノードのマクロが置き換えられました。
  • HPTMINEプロシジャの拡張により、品詞、属性、エンティティの選択や無視、検索インデックスの作成が可能になりました。
  • HP Text MinerノードはPROC HPTMINEを使用して、トピックのローテーションの実行とトピックテーブルの作成を行うようになりました。
  • 11の解析言語がHP Text Minerノードの言語プロパティに追加されました。解析言語は、中国語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語、トルコ語です。
  • 新しいマクロ変数EM_TERM_LOCを使用して、SAS Text Minerノードが出力データセットを書き込む場所を指定できます。これらのデータセットはSAS Text Minerスコアコードへの入力として必要です。
  • 語| 役割情報が含まれる_item_変数が、テキストトピックノードとテキストフィルタノードからエクスポートされるトランザクション出力に追加されました。データ分割ノードがプロセスフローダイアログ(入力データノード(NEWSなど) > データ分割ノード > テキスト解析ノード > テキストフィルタノードなど)内に使用される場合、この変数はトランザクションテーブルvalid_transとtest_transに追加されます。
    トランザクションテーブルに語 | 役割情報をエクスポートする利点の1つとして、アソシエーションノードにおいて、このノードがプロセスフローダイアグラム(入力データノード(ABSTRACTなど)> テキスト解析ノード > テキストフィルタノード > アソシエーションノードなど)内に使用されている場合に生成されるルールにこの情報が表示されることがあります。
ここでは、SAS Text Minerのハイパフォーマンスプロシジャの新機能と拡張の一部を説明します。
  • 新しいHPBOOLRULEプロシジャを使用すると、ブールルールを大規模なトランザクションデータから抽出できます。PROC HPBOOLRULEは、教師ありルールベースのモデリングに不可欠な機能をハイパフォーマンステキストマイニングに追加します。現在のリリースでは、HPBOOLRULEプロシジャを使用して、単一マシンモードでのみデータを読み込みルールを抽出できます。HPBOOLRULEプロシジャは、HPTMINEプロシジャによって処理されてトランザクション形式で表示されたテキストコーパスを分析することで、自動的にブールルールのセットを生成できます。
  • HPTMINEプロシジャは次の新しい言語、ステートメント、オプションをサポートします。
    • 新たにサポートされる言語のテキストデータを解析できます。これには、中国語、オランダ語、フィンランド語、フランス語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語、トルコ語があります。
    • HPTMINEプロシジャを使用して、テキストコーパスの検索インデックスを生成できます。テキストコーパスをクエリするには、TMUTILプロシジャでインデックスを使用します。
    • 新しいSELECTステートメントを使用して、分析に取り込むまたは除く品詞、エンティティまたは属性を指定できます。
    • HPTMINEプロシジャをSVDのみのモードで実行する場合に語テーブルを指定できます。語テーブルはトピック検索で必要です。

SAS Text Miner 13.2

SAS Text Miner 13.2はSAS 9.4M2上で稼働します。
ここでは、SAS Text Minerのハイパフォーマンスプロシジャの新機能と拡張の一部を説明します。
  • HPTMINEプロシジャは、次の新機能をサポートします。
    • ドイツ語のテキストデータを解析したり、ドキュメントの入力データセットでどの言語が使用されるかを指定したりできます。
    • 32Kを超える文字を含むドキュメントを解析できます。
    • SVD専用モードで実行できます。これにより、ドキュメントを解析して、ドキュメント解析後に2つのプロシジャ呼び出しでSVD計算に異なるパラメータを試す際に特異値分解(SVD)をぞれぞれ計算できます。
    • テキストコーパスに存在するトピックを検出できます。
    • Base64エンコードスパース行(BESR)形式で語/ドキュメントの行列を保存できます。
    • デフォルト座標リスト(COO、またはトランザクション)形式かBase64エンコードスパース行(BESR)形式のどちらかを使用して、語/ドキュメントの行列を保存できます。
    • カスタムエンティティおよび名詞グループ抽出にカスタムLITIファイルを指定できます。
    • OUTTERMS=データセットおよびOUTCHILD=データセットに_keep=Nが設定された語を含めるどうかを指定できます。
  • HPTMSCOREプロシジャは、次の新機能をサポートします。
    • ドイツ語のテキストデータを解析できます。
    • 32Kを超える文字を含むドキュメントを解析できます。
    • カスタムエンティティおよび名詞グループ抽出のカスタムLITIファイルがサポートされます。

SAS Text Miner 13.1

SAS Text Miner 13.1は、SAS 9.4M1以降のリリースで稼働するメジャーリリースです。このリリースでは、新しいテキストプロファイルノード、ノードのパフォーマンスと結果の拡張、ハイパフォーマンスHPTMINEプロシジャの拡張が提供されます。
  • 新しいテキストプロファイルノードによって、ドキュメントから検索された語を使用してターゲット変数をプロファイルできます。
  • テキスト解析ノードの新しい言語の選択プロパティによって、ドキュメント群に保持する言語を指定できます。
  • テキストトピックノードの結果には、次の新しい項目が含まれます。
    • テーブル。語と各トピックでのその重みを示します。
    • トピック語行列グラフ。複数語に対するトピック値を示します。
  • ハイパフォーマンスHPTMINEプロシジャのSVDステートメントのOUTDOCPRO=オプションは、NONORMDOCキーワードをサポートするようになり、ドキュメント予測の正規化の有無を制御できます。

SAS Text Miner 12.3

SAS Text Miner 12.3には、ノードのパフォーマンスと結果が拡張されました。各種ダイアログボックスでテーブル情報のインポートに使用する、インポートボタンがテーブルの置換テーブルの追加ボタンに置き換わりました。現在選択しているテーブルを置き換えるか、または現在選択しているテーブルに追加するかを選択できます。テキストルールビルダノードの結果には、新しいドキュメントルールテーブルとルール成功グラフが挿入されました。
SAS 9.4では、適切に有効化されたSAS ServerでSMPモードを使用できるため、プロセスフローダイアグラムにHP Text Minerノードを配置して、HPTMINEプロシジャとHPTMSCOREプロシジャを使用できます。プロセスフローダイアグラムのHP Text Minerノードを使用すると、多くの場合、マルチスレッド処理が得られます。詳細については、SAS Enterprise Miner High-Performance Data Mining Node ReferenceのHP Text Miner Node章を参照してください。
前のページ|次のページ|ページの先頭へ
最終更新: 2017/07/28