前のページ|次のページ

用語集

1バイト文字セット
1バイトのコンピュータメモリを使用して1文字を表現するエンコーディング。 1バイト文字セットの例として、Latin 1があります。略称: SBCS
2バイト文字セット
文字の表現に1バイトまたは2バイトのメモリが必要なエンコーディング。 2バイト文字セットの例として、日本語、韓国語、中国語があります。 略称: DBCS
ANSI
米国の製品やサービス、プロセス、システム、および人材の自発的な合意基準の策定の調整を計る組織。ANSIは国際規格を作成するために、ISO (国際標準化機構)と協力して活動しています。 略称: ANSI
ASCII
基本的な128文字のセットを提供し、多様なコンピュータシステムを支援する7ビットエンコーディング規格。 ASCIIでは、英文字の大文字と小文字、発音記号、数字(0-9)、コントロール文字をエンコードします。 この128文字のセットは、他のほとんどのエンコーディングにも含まれています。 略称: ASCII
BIDI
アラビア語やヘブライ語などの記述体系にみられる文字の向きで、通常、数字や埋め込みテキストを除き、右から左の向きになります。他の言語では、文字の向きは左から右になります。 略称: BIDI
bidi
BIDIを参照してください。
CEDA
任意のディレクトリベース動作環境(たとえば、Solaris、Windows、HP-UX、OpenVMSおよびz/OS)で作成されたSASデータファイルを、別のディレクトリベースの環境で実行されたSASセッションで読み込めるようにするSASの機能。 中間の変換ステップを使用せずに、SASデータファイルにアクセスできます。 略称: CEDA
DBCS
2バイト文字セットを参照してください。
EBCDIC
IBMメインフレームやミッドレンジコンピュータのデータを表現する1バイトやマルチバイトのエンコーディングファミリ。 EBCDICでは、英文字の大文字と小文字、発音記号、数字(0-9)、コントロール文字の拡張セットをエンコードします。 略称: EBCDIC
I18N
国際化を参照してください。
ISO
規格の策定を推進し、国家間での製品およびサービスの宣伝を促進するための関連活動を後援する組織。 知的、科学的、技術的情報の交換の支援も行います。 略称: ISO
ISO 646ファミリ
ISO 646規格に定義され、最大で128文字を含む7ビットエンコーディングのグループ名。 ISO 646エンコーディングは、ISO 646が各国バリアントで使用される12のコードポイントを持つという点を除いて、ASCIIに似ています。 各国バリアントは、特定の言語で必要とされる特殊文字です。
ISO 8859ファミリ
ISO 8859規格に定義された、16部からなる8ビットエンコーディングのセット。 それぞれのエンコーディングに、そのサポート言語で使用される128個のASCII文字と128個の拡張文字の両方が含まれます。 たとえば、Latin-1とも呼ばれるISO 8859-1は、ISO 8859ファミリ内でよく使用されるエンコーディングであり、ASCII文字と西ヨーロッパ言語で使用される文字を含みます。
MBCS
マルチバイト文字セットを参照してください。
NLS
ソフトウェアを各国の市場向けに正しく動作させるために必要な機能の集合。 略称: NLS
SBCS
1バイト文字セットを参照してください。
Unicode
世界の大部分の記述体系で表現されるテキストを矛盾なくエンコーディング、表現、処理するためのコンピュータ業界の規格。 Unicodeは、109,000を超える文字を含み、数十のスクリプト体、大文字小文字などの文字のプロパティの規格、双方向文字のスクリプト体の表示規格、多数の関連項目にも対応しています。
アクセント記号付き文字
発音を変えるアクセント記号を付けられて修飾された文字。 たとえば、"ñ"はチルダ(~)と文字"n"の組み合わせです。
エンコーディング
コード化された文字セットとコード値のマッピング。
エンコーディング方法
数値表現を文字セットの文字に割り当てるときに使用するルールセット。 たとえば、これらのルールにより、文字の数値表現を保存するときに使用するビット数とともに、文字が表示されるコードページの範囲を指定します。 エンコーディング方法は、コンピュータ業界で開発されてきた規格です。 多くの場合、エンコーディング方法は、コンピュータのハードウェアベンダに固有です。 よく使用されるエンコーディング方法として、ASCII、EBCDIC、ISO 646ファミリ、ISO 8859ファミリ、Unicodeがあります。
エンコード
特定の文字エンコーディング体系におけるデータの表記。 たとえば、ASCIIでは、文字"A"は16進表現の41として表記されます。
表語文字
発音ではなく、語や形態素を表す視覚的な記号。 中国の表語文字の例として、山という語を表す山があります。
拡張2進化10進コード
EBCDICを参照してください。
各国語サポート
NLSを参照してください。
各国語文字(ナショナルキャラクタ)
ラテン文字(A-Zとa-z)でない、ある記述体系に属する文字(文字、表意文字または象形文字)。
グラフィック文字
書き出し、印刷、表示が可能な文字。
クロス環境データアクセス
CEDAを参照してください。
言語
ロケールの1つの要素。任意の1つの国または地域に固有とは限りません。 たとえば、ポルトガル語は、ポルトガルだけでなくブラジルでも話されていますが、Portuguese_PortugalとPortuguese_Brazilは別々のロケールです。
国際化
1つの言語またはロケールに基づくという前提なしで行われる、ソフトウェア製品の設計処理。 国際化により、文字列の並べ替えと日付、時間、数、通貨の出力形式のルールを含む、国際的な規則がサポートされます。 また、一貫したユーザーエクスペリエンスを製品のどの言語版でも可能にします。 (略称: I18N)
国際標準化機構
ISOを参照してください。
コントロール文字
情報交換ではなくコントロールのために使用される文字。 通常、コントロール文字の出力はできません。
照合順序
テキストデータの並べ替えや比較を決定するルールのセット。
情報交換用米国標準コード(American Standard Code for Information Interchange)
ASCIIを参照してください。
双方向
BIDIを参照してください。
地域化
ターゲットの環境や市場の言語、文化、その他の要件を満たすように製品を適合させることで、顧客が製品を使用するときに自分の言語と規則を使用できるようにする処理。 ユーザーインターフェイス、システムメッセージ、ドキュメントの翻訳も地域化に含まれます。
データ表記
特定の動作環境でデータを保存するときの形式。 動作環境が異なると、使用される規格や規則も異なります。たとえば、浮動小数点数を保存する場合はIEEEやIBM 390、文字エンコーディングの場合はASCIIまたはEBCDIC、メモリ内のバイトオーダーではビッグエンディアンまたはリトルエンディアン、ワード配置では4バイト境界または8バイト境界、データ型の長さでは16ビット、32ビット、64ビットが使用されます。
特殊文字
英数字、アンダースコア(_)、空白以外の文字。 たとえば、アスタリスク(*)などがあります。
トランスコーディング
1つのエンコーディングから別のエンコーディングにSASファイルの内容を変換する処理。 トランスコーディングが必要になるのは、UNIXのLatin 1エンコーディングからIBMメインフレームのドイツ語EBCDICエンコーディングにデータを転送する場合のように、セッションエンコーディングとファイルエンコーディングが異なる場合です。
米国規格協会(American National Standards Institute)
ANSIを参照してください。
変換テーブル
1つの文字の値を別の文字の値に変換するときに使用する、動作環境に固有のSASカタログエントリ。 変換テーブルは、多くの場合、アプリケーションにおける複数の各国語の使用をサポートするために必要になります。 変換テーブルの例として、文字をEBCDICからASCII-ISOに変換するものがあります。
マルチバイト文字セット
文字の表現に1バイト以上のコンピュータメモリが必要なエンコーディング。 マルチバイト文字セットの例として、日本語、韓国語、中国語があります。 略称: MBCS
文字
意味を持つ、記述体系の最小構成要素(英文字、数字、表意文字など)。 文字は、特定の具象を示すのではなく、抽象的な意味を表します。
文字セット
言語または言語グループで使用される文字の集まり。 文字セットには、各国語文字、特殊文字、0から9の数字、コントロール文字などがあります。
ロケール
地域の言語、地域の規則および文化を反映する設定。 地域規則には、国または地域の用紙サイズ、日付、時刻、数字の出力形式、通貨記号が含まれます。 ロケールの値の例として、French_Canada、Portuguese_Brazil、Chinese_Singaporeなどがあります。
前のページ|次のページ|ページの先頭へ