大五碼(Big5)編碼

本節介紹了大五碼 (Big5) 的編碼方法,它是將大五碼三個區塊中的字元,依次排放到一個由兩個字節組成的數字二維矩陣中形成的。

大五碼 (Big5) 編碼? - 大五碼編碼是一個表格,它將大五碼字元集中的字元 根據以下規則轉換為兩個字節的數字代碼:

一。先將程式碼的兩個位元組的數字排成一個二維矩陣,用第一個字節表示行,用第二個字節表示列,

二。代碼的第一個字節的值必須大於或等於 0xA1。 這就規定了程式碼矩陣中只能有 (0xFF-0xA1+1) = 95 行。

三。代碼的第一個字節的值必須位於以下兩個範圍之一: 0x40 - 0x7E 和 0xA1 - 0xFE。 這就規定了代碼矩陣中只能有 (0x7E-0x40+1) + (0xFE-0xA1+1) = 157 列。

四。將「特殊符號」區中的符號,依序排列到程式碼矩陣中 的 0xA140 到 0xA3BF 範圍內。 這就給出了 2 個完整行和一個部分行的大五代碼,一共有 (0xA2-0xA1+1)*157 + ((0x7E-0x40+1)+(0xBF-0xA1+1)) = 408 個代碼。 例如,「§」的代碼為 0xA1B1。

五。將「一級漢字」區中的字元,依序排列到代碼矩陣中 的 0xA440 到 0xC67E 範圍內。 這就給出了 34 個完整行和一個部分行的大五代碼,一共有 (0xC5-0xA4+1)*157 + (0x7E-0x40+1) = 5401 個代碼。 例如,「仍」的代碼為 0xA4B4。

六。將「二級漢字」區中的字元,依序排列到代碼矩陣中 的 0xC940 到 0xF9D5 範圍內。 這就給出了 48 個完整行和一個部分行的大五代碼,一共有 (0xF8-0xC9+1)*157 + ((0x7E-0x40+1)+(0xD5-0xA1+1)) = 7652 個代碼。 例如,「圪」的代碼為 0xC9C9。

本書後半部列出了大五碼的全部字元和它們的程式碼。

Table of Contents

 說明与摘要

大五碼(Big5)字元集和編碼說明

 大五碼(Big5)字元集

大五碼(Big5)編碼

 大五碼(Big5)与Unicode的關係

 從大五碼到 Unicode 轉換表製作程式

 Big5 到 Unicode 轉換 - 特殊符號

 Big5 到 Unicode 轉換 - 一級漢字

 Big5 到 Unicode 轉換 - 二級漢字

 從 Unicode 到 Big5 轉換表製作程式

 Unicode 到 Big5 轉換 - 13,461 全部字元

 參考文獻

 PDF,EPUB,以及印刷版全版