前のページ|次のページ

Perl正規表現(PRX)を使用したパターンマッチング

パターンマッチングの定義

パターンマッチングを使うと、文字列から複数の一致パターンを一度に検索し、抽出できます。また、文字列中で複数の置換を一度に行うこともできます。これらを実行するには、DATAステップでPRXの関数とCALLルーチンを使用します。
たとえば、ある文字列の出現を複数検索し、それらの文字列を他の文字列と置換できます。また、ソースファイルから文字列を検索し、一致する位置を返すことができます。ファイルの中で重複している単語も検索できます。

Perl正規表現(PRX)の関数とCALLルーチンの定義

Perl正規表現(PRX)の関数とCALLルーチンとは、文字列を解析するパターンマッチング言語にPerlの修正バージョンを使用する関数グループとCALLルーチンを指します。次のタスクを実行できます。
  • 文字列内で文字パターンを検索
  • 文字列から部分文字列を抽出
  • テキストを検索して他のテキストに置換
  • Webログやその他のテキストデータなど、大量のテキストを解析
Perl正規表現は関数とCALLルーチンの文字列マッチングカテゴリを構成します。これらの関数とCALLルーチンの簡単な説明については、本書のディクショナリセクションのカテゴリ別の関数とCALLルーチンを参照してください。..

DATAステップでPerl正規表現を使用する利点

DATAステップでPerl正規表現を使えば、テキストの検索と置換のオプションが強化されます。Perl正規表現を使用すると、次のタスクを実行できます。
  • データの検証
  • テキストの置換
  • 文字列から部分文字列を抽出
正規表現を使わずにSASプログラムを記述し、Perl正規表現を使用したときと同じ結果を得ることは可能です。ただし、正規表現を使わないコードでは、文字列中の文字位置を扱い、文字列の一部を操作するために、より多くの関数呼び出しが必要となります。
Perl正規表現は、これらのステップのすべてではないものの、ほとんどを1つの表現にまとめます。完成されたコードはよりエラーが起きにくく、保守が簡単で読みやすいものとなります。
前のページ|次のページ|ページの先頭へ