エンコーディングは、文字セットの要件に対処するために提供されています(英語のAからZと同じ26文字を使用する言語はほとんどありません)。すべての言語は、次のクラスの文字セットのいずれかを使用して表記されます。
SBCS (Single-Byte Character Set、1バイト文字セット)
各文字を1バイトで表します。1バイト文字セットは、7ビット(最大128文字を提供)または8ビット(最大256文字を提供)に設定できます。一例として、8ビットSBCSにはISO
8859-5 (キリル語)文字セット(ロシア語文字を表現)があります。
DBCS (Double-Byte Character Set、2バイト文字セット)
東アジア文字セット(日本語、韓国語、簡体字中国語、繁体字中国語)を示します。ほとんどの文字は複数バイトで構成されるため、さまざま幅を持つエンコーディングが必要です。用語としてDBCS
(Double-Byte Character Set)がMBCS (Multi-Byte Character Set、複数バイト文字セット)よりも一般的に使用されていますが、MBCSの方が適切です。複数バイトが必要なのは、東アジア文字セットのほとんどの(すべてではない)文字です。
MBCS (Multi-Byte Character Set、複数バイト文字セット)