內容
詞彙
- ANSI
-
請參閱美國國家標準局 (American National Standards Institute)
- ASCII
-
請參閱美國資訊交換標準碼 (American Standard Code for Information Interchange)
- CCS
-
請參閱編碼字元集 (coded character set)
- CEDA
-
請參閱跨環境資料存取 (Cross-environment Data Access)
- DBCS
-
請參閱雙位元組字元集 (double-byte character set)
- EBCDIC
-
請參閱延伸二進位編碼十進位交換碼 (Extended Binary Coded Decimal Interchange Code)
- I18N
-
請參閱國際化 (internationalization)
- ISO
-
推動標準開發並贊助相關活動,以促使產品與服務遍及各個國家的組織。它也可支援智慧、科學和技術資訊的交換。簡短格式:ISO。
- ISO 646 系列 (ISO 646 family)
-
以 ISO 646 標準定義的一組 7 位元編碼。此編碼包含 116 個不變的 ASCII 字碼位置,以及 12 個可由國家字元取代的可變字碼位置。例如,字碼位置
23 (十六進位值) 會保留給可變字元。此位置在美國會由井字號 (#) 使用,在英國則由符號 (£) 使用。ISO 646 的國家變異大多已淘汰。
- ISO 8859 系列 (ISO 8859 family)
-
以 ISO 8859 標準定義的一組 8 位元編碼 (16 個)。每個編碼都包含 128 個 ASCII 字元和 128 個延伸字元 (用於編碼所支援的一或多個語言)。例如,ISO
8859-1 (也稱為 Latin-1) 是 ISO 8859 系列中含有 ASCII 字元及西歐語言所使用字元的常用編碼。
- L10N
-
請參閱本土化 (localization)
- MBCS
-
請參閱多位元組字元集 (multi-byte character set)
- NLS
-
請參閱國家語言支援 (national language support)
- SBCS
-
請參閱單位元組字元集 (single-byte character set)
- Unicode
-
以全球大部分書寫系統來表示文字的一致編碼、表示和處理的運算產業標準。
- 本土化 (localization)
-
使軟體適用於特定地理文化區域 (地區設定) 的程序。翻譯使用者介面、系統訊息和文件,是本土化程序的主要部分。簡短輸出格式:L10N。
- 地區設定 (locale)
-
反映地理區域之語言、當地慣例和文化的設定。當地慣例可以包含國家或地區之紙張大小、日期、時間和數字以及貨幣符號的特定輸出格式規則。部分地區設定值範例有 French_Canada、Portuguese_Brazil
和 Chinese_Singapore。
- 多位元組字元集 (multi-byte character set)
-
因有許多字元佔用多個位元組的記憶體而需使用變數寬度編碼的字元集。
DBCS 與 MBCS 有時可互相通用,但 MBCS 較能精準說明日文、韓文與中文等語言的字元集。簡短格式:MBCS。
- 字元 (character)
-
具有語意值 (如字母、數字或表意文字的字母) 之寫入系統的最小元件。
- 字元集 (character set)
-
請參閱字元編碼 (character encoding)
- 字元編碼 (character encoding)
-
一種語言或一組語言所使用的字元集合。字元編碼包含國家字元、特殊字元、數字 0-9 和控制字元。
- 字碼頁
-
使十六進位值與每個字元產生關聯之字元集的表示法。
- 延伸二進位編碼十進位交換碼 (Extended Binary Coded Decimal Interchange Code)
-
單位元組和多位元組編碼系列,用於在 IBM 大型主機和中型電腦上表示資料。
簡短格式:EBCDIC
- 定序序列 (collating sequence)
-
決定文字資料之排序和比較方式的一組規則。
- 美國國家標準局 (American National Standards Institute)
-
在美國合作開發產品、服務、程序、系統和個人之自願性共識標準的組織。ANSI 會與國際標準化組織 (International Organization for Standardization)
合作,以建立全球標準。簡短格式:ANSI。
- 美國資訊交換標準碼 (American Standard Code for Information Interchange)
-
7 位元編碼標準,提供一組支援各種電腦系統的基本 128 個字元。ASCII 會編碼英文字母、標點符號、數字 0-9 和控制字元的大寫和小寫字母。這組 128 個字元也包含在大部分的其他編碼中。簡短格式:ASCII。
- 重音字元 (accented character)
-
透過增加重音符號所修改的字元類型,而重音符號會變更字元的發音。
"ñ" 即為一例,這是結合波狀符號 (~) 與字元 "n" 而產生的。
- 特殊字元 (special character)
-
非英數字元、底線 (_) 和空白的字元類型。範例是星號 (*)。
- 國家字元 (national character)
-
因在一個國家或一組國家中書寫,而專用於某個語言的字元。例如,具有波狀符號 (ñ) 的字母 “n” 是西班牙的國家字元。
- 國家語言支援 (national language support)
-
讓軟體產品在每個要使用該產品之全球市場中正確運作的功能集。簡短格式:NLS。
- 國際化 (internationalization)
-
不根據單一語言或地區設定進行假設,藉以促進本土化的軟體產品設計程序。國際化可確保支援國際慣例 (包含用於排序字串以及輸出格式化日期、時間、數字和貨幣的規則)。
它也有利於產品的不同語言版本有一致的使用者體驗 簡短輸出格式:I18N。
- 國際標準化組織 (International Organization for Standardization)
-
請參閱 ISO
- 控制字元 (control character)
-
用於控制而非資訊交換的字元類型。控制字元通常是不可列印的。
- 單位元組字元集 (single-byte character set)
-
使用電腦記憶體的一個位元組來表示每個字元的編碼類型。單位元組字元集範例有 Latin 1。簡短格式:SBCS。
- 資料表示法 (data representation)
-
在特定作業環境中儲存資料的形式。不同的作業環境會針對下列項目使用不同的標準或慣例:儲存浮點數 (例如,IEEE 或 IBM 390)、字元編碼 (ASCII 或 EBCDIC)、記憶體中位元組順序
(big endian 或 little endian)、單字對齊 (4 位元組界限或 8 位元組界限) 及資料類型長度 (16 位元、32 位元或 64 位元)。
- 跨環境資料存取 (Cross-environment Data Access)
-
SAS 軟體的功能之一,可讓在目錄型作業環境中建立的 SAS 資料檔案,供其他目錄型環境中的 SAS 工作階段讀取。簡短輸出格式:CEDA
- 語標 (logogram)
-
代表單字或語素而非語音的視覺符號。"mountain" 的中文語標範例為「山」。
- 圖形字元 (graphic character)
-
可以寫入、列印或顯示的字元類型。
- 編碼 (encode)
-
以特定字元編碼配置來表示資料。例如,在 ASCII 中,字母 "A" 會以 41 (十六進位值) 表示。
- 編碼 (encoding)
-
編碼字元集與代碼值的對應。
- 編碼方法 (encoding method)
-
應用針對編碼字元集而建立的業界規則來產生編碼字元配置的方法。
此類規則會訂定儲存特定字元的數值表示法時所需的位元數,以及該字元的字碼在編碼中的位置。舉例來說,ISO 2022 與 UTF-8 皆為編碼方法。
- 編碼字元集 (coded character set)
-
抽象字元表與數值集的對應。ISO Latin-1 編碼字元集會提供西歐語系字母與符號及其數值表示法。
例如,字母 "Ä" 會以 C4 (十六進位值) 表示。
簡短輸出格式:CCS
- 轉碼 (transcoding)
-
將 SAS 檔案的內容從某個編碼轉換為另一個編碼的程序。如果工作階段編碼和檔案編碼不同 (例如,將資料從 UNIX 下的 Latin 1 編碼傳輸為 IBM 大型主機上的德文
EBCDIC 編碼時),便需要轉碼。
- 轉譯表格 (translation table)
-
用來將資料從一個編碼對應至另一個編碼的 SAS 目錄項目。控制地區設定值與編碼屬性的 SAS 語言元素會自動叫用適當的轉譯表格。轉譯表格會隨作業環境而不同;例如,將
Windows Latin 2 編碼對應至 ISO Latin 2 編碼的轉譯表格。
- 雙向文字
-
一般從右到左的寫入系統中的文字,如阿拉伯文和希伯來文 (以從左到右的其他語言寫入的數字和內嵌文字除外)。
- 雙位元組字元集 (double-byte character set)
-
因有許多字元佔用兩個位元組的記憶體而需使用變數寬度編碼的字元集。DBCS 在傳統上套用於日文、韓文與中文等語言上,因此多少會產生誤導,因為有些 DBCS 字元實際上只需要一個位元組。簡短格式:DBCS。
Copyright © SAS Institute Inc. All rights reserved.