エンコーディングは、文字セットの各文字を一意の数値表現にマッピングし、すべてのコードポイントからなるテーブルを構成します。コードページと呼ばれるこのテーブルは、順序に従って並べられた文字セットで、各文字に数値のインデックス(コードポイント値)が関連付けられます。コードページ上の文字の位置によって、2桁の16進数が決まります。
たとえば、Windows Latin1エンコーディングのコードページは次のようになります。次の例では、行によって1桁目が決まり、列によって2桁目が決まります。大文字Aの数値表現は16進数の41、等記号(=)の数値表現は16進数の3Dです。
文字セットは、文字と記号のセットで、言語または言語のグループで使用されます。文字セットには、各国語文字(特定の国または国のグループに固有の文字)、特殊文字(句読点など)、アクセント記号のないラテン文字AからZ、数字0から9、コンピュータに必要なコントロール文字が含まれます。
エンコーディング方法は、数値表現を文字のセットに割り当てる一連のルールです。これらのルールによって、エンコーディングのサイズ(文字の数値表現の保存に使用されるビット数)と文字が表示されるコードページの範囲が決まります。エンコーディング方法は、コンピュータ業界で開発された標準に従って定義されています。多くの場合、エンコーディング方法は、コンピュータハードウェアベンダに固有です。
エンコーディングは、エンコーディング方法を文字セットに適用した結果です。
個々の文字には、使用するコードページによって、コードページの異なる位置が割り当てられます。たとえば、ドイツ語の大文字Äは、次のようになります。
-
Windows Latin1コードページ(1252)では、16進数のC4として表されます。
-
ドイツ語EBCDICコードページ(1141)では、16進数の4Aとして表されます。
次の例では、列によって1桁目が決まり、行によって2桁目が決まります。
各SASセッションは、デフォルトのエンコーディングに設定されます。これは、さまざまなSAS言語要素を使用して指定できます。