大五碼(Big5)编码

本节介绍了大五碼(Big5)的编码方法,它是将大五碼三区块中的字符,依次排放到一个由两个字節组成的数字二維矩陣中形成的。

大五碼(Big5)編碼? - 大五碼編碼是一个表格,它将大五碼字符集中的字符 根據以下規則轉換為两个字節的数字代码:

一。先将代码的两个字節的数字排成一个二維矩陣,用第一个字節表示行,用第二个字節表示列,

二。代碼的第一個字节的值必須大於或等於0xA1。 這就规定了代码矩陣中只能有 (0xFF-0xA1+1) = 95 行。

三。代碼的第一個字节的值必須位於以下兩個範圍之一: 0x40 - 0x7E 和 0xA1 - 0xFE。 這就规定了代码矩陣中只能有 (0x7E-0x40+1) + (0xFE-0xA1+1) = 157 列。

四。将「特殊符號」區中的符號,依次排列到代码矩陣中 的 0xA140 到 0xA3BF 範圍內。 這就給出了 2 個完整行和一個部分行的大五代碼,一共有 (0xA2-0xA1+1)*157 + ((0x7E-0x40+1)+(0xBF-0xA1+1)) = 408 個代碼。 例如,「§」的代码为 0xA1B1。

五。将「一级漢字」區中的字符,依次排列到代码矩陣中 的 0xA440 到 0xC67E 範圍內。 這就給出了 34 個完整行和一個部分行的大五代碼,一共有 (0xC5-0xA4+1)*157 + (0x7E-0x40+1) = 5401 個代碼。 例如,「仍」的代码为 0xA4B4。

六。将「二级漢字」區中的字符,依次排列到代码矩陣中 的 0xC940 到 0xF9D5 範圍內。 這就給出了 48 個完整行和一個部分行的大五代碼,一共有 (0xF8-0xC9+1)*157 + ((0x7E-0x40+1)+(0xD5-0xA1+1)) = 7652 個代碼。 例如,「圪」的代码为 0xC9C9。

本書後半部列出了大五碼的全部字元和它們的程式碼。

Table of Contents

 说明与摘要

大五碼(Big5)字符集和编码说明

 大五碼(Big5)字符集

大五碼(Big5)编码

 大五碼(Big5)与Unicode的关系

 從 Big5 到 Unicode 轉換表製作程式

 Big5 到 Unicode 轉換 - 特殊符號

 Big5 到 Unicode 轉換 - 一级漢字

 Big5 到 Unicode 轉換 - 二级漢字

 從 Unicode 到 Big5 轉換表製作程式

 Unicode 到 Big5 轉換 - 13,461 全部字符

 參考文獻

 PDF,EPUB,以及印刷版全版