%TMFILTERマクロは、ファイルをSASデータセットに変換するSASマクロです。%TMFILTERマクロは、SAS Text Minerと共に提供されます。同マクロのフィルタリング機能はすべてのオペレーティングシステムでサポートされており、クロール機能はWindows上でサポートされています。%TMFILTERマクロは、Windowsマシン上にインストールされ実行されているSAS
Document Conversion Serverを利用します。詳細については、SAS Document Conversion Serverのマニュアルを参照してください。
このマクロを使用して次のタスクを実行できます。
-
任意のサポートされているフォーマットで保存されているドキュメントコレクションをフィルタリングし、SAS Text Minerのデータソースの作成に使用できるSASデータセットを出力すること。
-
Webクロールを実施し、SAS Text Minerのデータソースの作成に使用できるSASデータセットを出力すること。Webクロールは、開始Webページのテキストを取得し、同ページ内のURLリンクを抽出した後、それらのリンク先のページ内で同じ処理を再帰的に繰り返します。また、開始URLのドメインに対するクロールを禁止することや、開始URLのドメイン内には存在しないリンク先のページをクロールすることもできます。クロールは、指定されたドリルダウンのレベル数に達するまで、またはドメイン制約を満たすWebページが見つかるまで続けられます。Webクロール機能は、Windowsオペレーティングシステムでのみサポートされています。
-
コレクション内のすべてのドキュメントの言語を識別すること。
%TMFILTERマクロの詳細については、SAS Text Minerのヘルプを参照してください。