この例では、SAS Enterprise Minerが実行されていること、SAS Document Conversion Serverが実行されていること、およびダイアグラムワークスペースがプロジェクトで開かれていることを前提としています。プロジェクトとダイアグラムの作成に関する詳細は、
プロジェクトの設定を参照してください。
注: Webクロール機能は、Windowsオペレーティングシステムでのみサポートされています。
Webからドキュメントをインポートするには、次の手順を実行します。
-
テキストマイニングタブを選択し、
テキストインポートノードをダイアグラムワークスペースへとドラッグします。
-
テキストインポートノードの
インポートファイルディレクトリプロパティの隣にある省略記号ボタンをクリックします。
サーバーディレクトリの選択ダイアログボックスが表示されます。
-
フォルダに移動し、同フォルダを選択した後、
OKをクリックします。
ドキュメントは、まずインポートファイルディレクトリの場所に書き出されます。これらのファイルは、インポートファイルディレクトリの場所で処理された後、出力先ディレクトリの場所に書き出されます。
-
テキストインポートノードの
URLプロパティで、クロール対象としたいWebページのURLを入力します。たとえば、
www.sas.comと入力します。
-
深さプロパティには、クロール対象とするレベル数として
1を入力します。
-
注: パスワードで保護されているWebサイトをクロールしたい場合、ドメインプロパティを制限
に設定した後、ユーザー名プロパティにユーザー名を、パスワードプロパティにパスワードをそれぞれ設定します。
-
テキストインポートノードを右クリックし、
実行を選択します。
-
-
同ノードの実行完了後に表示される
実行ステータスダイアログボックス内で
結果をクリックします。