前のページ|次のページ

テキストインポートノードの使用

本セクションの内容

テキストインポートノードを使用すると、ディレクトリやWebからドキュメントをインポートできます。テキストインポートノードの使用例については、次のページを参照してください。プロジェクトとダイアグラムの作成に関する詳細は、プロジェクトの設定を参照してください。

ディレクトリからのドキュメントのインポート

この例では、SAS Enterprise Minerが実行されていること、SAS Document Conversion Serverが実行されていること、およびダイアグラムワークスペースがプロジェクトで開かれていることを前提としています。プロジェクトとダイアグラムの作成に関する詳細は、プロジェクトの設定を参照してください。
ディレクトリからドキュメントをインポートするには、次の手順を実行します。
  1. テキストマイニングタブを選択し、テキストインポートノードをダイアグラムワークスペースへとドラッグします。
    テキストインポートノードアイコン
  2. テキストインポートノードのインポートファイルディレクトリプロパティの隣にある省略記号ボタンをクリックします。
    サーバーディレクトリの選択ダイアログボックスが開きます。
  3. データセットの作成元とするドキュメントを含むフォルダへと移動し、同フォルダを選択した後、OKをクリックします。
    注: 選択可能なファイルの種類を確認するには、種類ドロップダウンメニューですべてのファイルを選択します。
  4. 言語プロパティの隣にある省略記号ボタンをクリックします。
    言語ダイアログボックスが開きます。
  5. 言語IDを各ドキュメントの言語に割り当てる場合に必要となるライセンス言語を1つ以上選択した後、OKをクリックします。
  6. (オプション)拡張子プロパティで、処理対象とするファイルの種類を指定します。
    たとえば、拡張子.txtおよび.pdfを持つファイルのみを処理対象としたい場合、拡張子プロパティの値として.txt .pdfを指定し、キーボード上のEnterキーを押します。
    注: 処理対象とするファイルの種類を指定しない場合、テキストインポートノードは指定されたインポートファイルディレクトリ内にあるすべてのファイルタイプを処理します。
  7. テキストインポートノードを右クリックし、実行を選択します。
  8. 確認ダイアログボックスではいをクリックします。
  9. 同ノードの実行完了後に表示される実行ステータスダイアログボックス内で結果をクリックします。
  10. インポートしたドキュメント内の結果を調べます。
    この時点で、テキストインポートノードを、各自のテキストマイニング分析の入力データソースとして使用できるようになります。
  11. テキストマイニングタブを選択し、テキスト解析ノードをダイアグラムワークスペースへとドラッグします。
  12. テキストインポートノードをテキスト解析ノードに接続します。
  13. テキスト解析ノードを右クリックし、実行を選択します。
  14. 確認ダイアログボックスではいを選択します。
  15. これらのノードの実行完了後に表示される実行ステータスダイアログボックス内で結果をクリックします。

Webからのドキュメントのインポート

この例では、SAS Enterprise Minerが実行されていること、SAS Document Conversion Serverが実行されていること、およびダイアグラムワークスペースがプロジェクトで開かれていることを前提としています。プロジェクトとダイアグラムの作成に関する詳細は、プロジェクトの設定を参照してください。
注: Webクロール機能は、Windowsオペレーティングシステムでのみサポートされています。
Webからドキュメントをインポートするには、次の手順を実行します。
  1. テキストマイニングタブを選択し、テキストインポートノードをダイアグラムワークスペースへとドラッグします。
    テキストインポートノードアイコン
  2. テキストインポートノードのインポートファイルディレクトリプロパティの隣にある省略記号ボタンをクリックします。
    サーバーディレクトリの選択ダイアログボックスが表示されます。
  3. フォルダに移動し、同フォルダを選択した後、OKをクリックします。
    ドキュメントは、まずインポートファイルディレクトリの場所に書き出されます。これらのファイルは、インポートファイルディレクトリの場所で処理された後、出力先ディレクトリの場所に書き出されます。
  4. テキストインポートノードのURLプロパティで、クロール対象としたいWebページのURLを入力します。たとえば、www.sas.comと入力します。
  5. 深さプロパティには、クロール対象とするレベル数として1を入力します。
  6. ドメインプロパティを無制限に設定します。
    注: パスワードで保護されているWebサイトをクロールしたい場合、ドメインプロパティを制限に設定した後、ユーザー名プロパティにユーザー名を、パスワードプロパティにパスワードをそれぞれ設定します。
  7. テキストインポートノードを右クリックし、実行を選択します。
  8. 確認ダイアログボックスではいをクリックします。
  9. 同ノードの実行完了後に表示される実行ステータスダイアログボックス内で結果をクリックします。
前のページ|次のページ|ページの先頭へ