Big5碼與Unicode碼之差異性

由於hugo每天都要在字碼中打滾,自然而然的對各種編碼有較基本的認知,也發現到一般的使用者,或是資訊相關人員其實對字碼的部份也不甚了解,所以在這前提之下讓hugo想把兩者的差異性寫成較簡單的文章,供大家參考。在此文章內將先不論兩者編碼之規範,單純以收錄字數做單一比較。

「何謂Big5」

以下轉載自Wiki

「五大碼」(Big5) 是在1984年台灣13家廠商製作開發五大中文套裝軟體,由中華民國財團法人資訊工業策進會為五大中文套裝軟體所設計的中文內碼,所以就稱為Big5中文內碼,雖然五大套裝軟體並沒有成功,但隨著採用Big5碼的國喬中文系統及倚天中文系統先後在台灣市場獲得成功,使得Big5碼深遠地影響正體中文電腦內碼,直至今日[2][3]。「五大碼」的英文名稱「Big5」後來被人按英文字序譯回中文,以致現在有「五大碼」和「大五碼」兩個中文名稱。

但因在制定編碼時沒有考量到人名、地名等常用字,所以像是堃、峯、喆、綉等字在以Big5為編碼的系統上是無法顯示的,如早期的Windows98。

「何謂Unicode」

以下轉載自Wiki

Unicode是由於傳統的字元編碼方式的侷限性而產生的,例如 ISO 8859 所定義的字元雖然在不同的國家中廣泛地使用,可是在不同國家間卻經常出現不相容的情況。很多傳統的編碼方式都具有一個共通的問題,即其容許電腦進行雙語環境式的處理(通常使用拉丁字母以及其本地語言),但卻無法同時支援多語言環境式的處理(指可同時處理混合多種語言的情況)。

Unicode試圖將字位(字素,graphemes)與類字位字元加以認定與編碼,而非以不同的字形(glyphs)來加以區分。然而在漢字的個案來看,這樣方式有時會引起一字多形的認定爭議(詳見中日韓統一表意文字主題)。

看上述的解釋其實有點複雜,以較簡單的方式說明則是「Unicode整合了各國不同之語系並給與標準化」,其中當然也包括了正體中文,簡體中文等。

「Big5與Unicode的差異」

接下來有了基本的認知後,應該就可以知道Unicode是一個比較大的字集,因為收錄了各國的字型,但其中的CJK,其中也包含了原本Big5所收納的字數,如下圖所示。

說明

而這些差異字就高達7,399字,這些字也包含了大部份的人名罕字及地址罕字等。簡單講這也就是big5跟unicode的主要差異性。

這是hugo第一次寫關於中文字碼的文章,盡量是以簡單的方式來說明,雖然可能乏味了點,不過如果想更進一步的了解都可以留言給我 :-P


Related Posts
何謂UTF-8、UTF-16及UTF-32
什麼是UTF-8?其實在Wiki中有寫到,UTF是Unicode Transformation Format的縮寫,如就字面上翻譯的話是「Unicode轉換格式」。而數字8則表示是用八個位元所組成的編碼,16就表示用十六個位元組成。
READ MORE
[筆記] iPAD 漫畫閱讀軟體
使用iPAD也蠻久的一段時間了,用大部分都是使用在閱讀電子書跟線上漫畫的部份,說實在蠻少拿來上網或者是玩遊戲的,在網路上搜尋一些文章後,發現大家使用的漫畫閱讀工具都不太一樣,在這邊列出我個人比較後留下來的一些軟體。
READ MORE
[筆記] TP-Link TL-WR941ND & 841ND刷Gargoyle韌體
在網路上找了一些文章,雖然可以將941ND與841ND刷成DD-WRT的韌體,但是所找到的文章都說無線及QoS的部份設定上好像會有問題所以不在考慮當中,剩下可以使用的第三方韌體就只有OpenWrt及Gargoyle了...
READ MORE
[筆記] Google Calendar Sync 選取設定檔問題
因工作的需要都會將outlook的行事曆同步到google calendar上,所以自然會安裝google所提供的Google Calendar Sync這工具,當設定完成要同步行事曆時,這小工具都會跳出要選取設定檔的對話框...
READ MORE
[筆記] 如何讓ASUS N-12無線速度符合ADSL 50M
在網路上找到的文章都說N-12在無線部份只能跑到20-30M左右,實在越想越奇怪,明明就是802.11n支援到300M,怎麼可能連一半都跑不到,過了兩個星期的google之後,今天終於找到了解答。
READ MORE
在這勝利的半年,除了各家的高手發表的Homebrew外,我個人比較有興趣的是Showtime這款軟體,這是一款支援各系統的撥放器,據我個人初淺的了解應該是第一個可以在ps3上外掛字幕的撥放器,使用上也不需要像PS3 Media Server一樣,還需透過PC來進行轉檔,而是直接把檔案放在PS3的目錄底下即可。
READ MORE
三款免費PDF轉檔軟體評比
因為最近在工作上遇到了一個小問題,主要就是先前所使用的pdf軟體,如果檔名是中文的話,則轉換後檔名僅會顯示ANSI的字元,每次轉完都需要自己在改一次檔名,所以測試了目前幾款免費的PDF轉換軟體,供各位參考。
READ MORE
解決Windows 7播放DVD無字幕問題
今天跟女王一起看DVD-Image時,發現字幕都出不來,明明有設定但是就是沒有字幕,而且妙的是用Windows 7內建的Media Player Center撥放就有字幕,但用MPC就是沒有,不死心的我找了老半天才找到解答
READ MORE
何謂UTF-8、UTF-16及UTF-32
ReportViewer Export to PDF
使用者定義字元 (EUDC) 無法正確顯示
[筆記] iPAD 漫畫閱讀軟體
[筆記] TP-Link TL-WR941ND & 841ND刷Gargoyle韌體
[筆記] Google Calendar Sync 選取設定檔問題
[筆記] 如何讓ASUS N-12無線速度符合ADSL 50M
[PS3] Showtime 播放繁體字幕
三款免費PDF轉檔軟體評比
解決Windows 7播放DVD無字幕問題

本著作係採用創用 CC 姓名標示-非商業性-禁止改作 3.0 台灣 授權條款授權。