編碼會將字元集中的每個字元對應至唯一數值表示法,以產生所有字碼指標的表格。此表格稱為字碼頁,而字碼頁是一組排序過且數值索引 (字碼指標值) 與每個字元相關聯的字元。
字碼頁上字元的位置可決定其兩位數的十六進位數字。
例如,下列是 Windows Latin1 編碼的字碼頁。在下列範例中,列決定第一個數字,而欄決定第二個數字。大寫 A 的數值表示法是十六進位數字 41,而等號
(=) 的數值表示法是十六進位數字 3D。
字元集是一種語言或一組語言所使用的一組字元和符號。字元集包含國家字元 (為特定國家或一組國家特有的字元)、特殊字元 (如標點符號)、無重音拉丁字元 A–Z、數字
0–9 以及電腦所需的控制字元。
編碼方法是指派數值表示法給字元集的一組規則。這些規則控管編碼大小 (用來儲存字元之數值表示法的位元數) 和字元所在字碼頁中的範圍。編碼方法是遵循運算產業中已開發的標準而產生。編碼方法通常是電腦硬體廠商特有的。
編碼是將編碼方法套用至字元集的結果。
個別字元會佔用字碼頁中的不同位置 (視使用的字碼頁而定)。例如,德文大寫字母 Ä:
-
是以 Windows Latin1 字碼頁 (1252) 的十六進位數字 C4 來表示
-
是以德文 EBCDIC 字碼頁 (1141) 的十六進位數字 4A 來表示
在下列字碼頁範例中,德文是字元集,而 EBCDIC 是編碼方法。
在下列範例中,欄決定第一個數字,而列決定第二個數字。
每個 SAS 工作階段都會設為預設編碼,您可以使用各種 SAS 語言元素來指定預設編碼。