標籤: 暫無標籤

  通用字符集(Universal Character Set,UCS)是由iso制定的ISO 10646(或稱ISO/IEC 10646)標準所定義的字元編碼方式,採用4位元組編碼。


  又稱Universal Multiple-octet Coded Character Set,大陸譯為通用多八位編碼字符集,台灣譯為廣用多八位元編碼字元集。


  
概要


  


  通用字符集是所有包括了其他字符集。它保證了與其他字符集的雙向兼容,即,如果你將任何文本字元串翻譯到UCS格式,然後再翻譯回原編碼,你不會丟失任何信息。


  UCS包含了已知語言的所有字元。除了拉丁語、希臘語、斯拉夫語、希伯來語、阿拉伯語、亞美尼亞語、喬治亞語,還包括中文、日文、韓文這樣的象形文字,UCS還包括大量的圖形、印刷、數學、科學符號。


  ISO 10646定義了一個31位的字符集。


  ISO 10646-1標準第一次發表於1993年,現在的公開版本是ISO/IEC 10646-1:2000。ISO 10646-2在2001年發表。


  UCS不僅給每個字元分配一個代碼,而且賦予了一個正式的名字。表示一個UCS或Unicode值的十六進位數通常在前面加上「U+」,例如「U+0041」代表字元「A」。

上一篇[枸杞拌蓮藕]    下一篇 [李善榮]

相關評論

同義詞:暫無同義詞