Re: [問題] 請教Big5 和UTF-8 的編碼差異... - 精華區Web_Design

文章推薦指數: 80 %
投票人數:10人

採用變動大小,中文字使用3 bytes,英文則維持1 byte 因此若轉碼後,資料庫整體會變成1.5 倍大,200MB(Big5) -> 300MB(UTF-8) 2. 批踢踢實業坊 › 精華區betaWeb_Design 關於我們 聯絡資訊 返回上層 作者ckmarkhsu(深藍站長)看板Web_Design標題Re:[問題]請教Big5和UTF-8的編碼差異...時間WedMar2912:44:402006 這網路上有非常多資料:P 簡單來說(以下全部是經驗談) Big5有幾個特色 1.每個中文字使用2bytes 2.因為制定者腦殘,用到了控制碼 所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題 3.延伸字集中,有簡體字但是沒有定義日文字 UTF-8則有以下特色 1.採用變動大小,中文字使用3bytes,英文則維持1byte 因此若轉碼後,資料庫整體會變成1.5倍大,200MB(Big5)->300MB(UTF-8) 2.支援所有語言文字,還有一些怪怪圖形:P 3.簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山" 是同一個UTF-8編碼 至於怎麼轉碼呢.... php只要使用iconv函數即可 安裝方式http://www.twvbb.com/vbb/showthread.php?t=299 使用方式http://tw.php.net/iconv ※引述《punpun(小金)》之銘言: :請問有大大可以分享一下 :有關Big5和UTF-8編碼文字互相轉換的流程 -- ※發信站:批踢踢實業坊(ptt.cc) ◆From:140.112.249.201 →ilovebbs:一般來說,用哪種會比較好啊[email protected]@03/2913:05 →ckmarkhsu:當然是UTF-8阿:P03/2913:27 推gckenny:utf-8+103/2914:04 推ogamenewbie:推b2XD03/2919:37 推ileadu:光靠iconv還做不出來…03/2920:53 推ckmarkhsu:為什麼做不出來?03/2923:56 推ast9869:為什麼做不出來+103/3014:41 →ast9869:UTF8+103/3014:41 推ileadu:比方說,簡體字如何從utf-8轉成big5?03/3016:05 →ileadu:utf-8涵蓋範圍較廣,要是能這樣輕鬆轉換就好了…03/3016:07 推ckmarkhsu:你這有點...那阿拉伯文也沒辦法轉成big5阿Orz....03/3019:34 →ckmarkhsu:且很少人會把簡體的UTF8轉成Big5吧:P03/3019:36 →ckmarkhsu:如果真的要轉,掛個3-party的函數即可:P我有寫:P03/3019:36 推ileadu:有寫還不拿來分享:p03/3019:53 >--------------------------------------------------------------------------< 作者:ckmarkhsu(深藍站長)看板:Web_Design 標題:Re:[問題]請教Big5和UTF-8的編碼差異... 時間:ThuMar3021:28:452006 http://www.twvbb.com/vbb/showthread.php?t=572 剛剛有網友提到,如果是UTF-8編碼下的簡體恐無法轉成Big5... 不過還是有個辦法 我寫的這隻function可以支援UTF-8正體簡體轉換 只要將簡體轉成正體後,再incov即可:) ※引述《ckmarkhsu(深藍站長)》之銘言: :這網路上有非常多資料:P :簡單來說(以下全部是經驗談) :Big5有幾個特色 :1.每個中文字使用2bytes :2.因為制定者腦殘,用到了控制碼 :所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題 :3.延伸字集中,有簡體字但是沒有定義日文字 :UTF-8則有以下特色 :1.採用變動大小,中文字使用3bytes,英文則維持1byte :因此若轉碼後,資料庫整體會變成1.5倍大,200MB(Big5)->300MB(UTF-8) :2.支援所有語言文字,還有一些怪怪圖形:P :3.簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山" :是同一個UTF-8編碼 :至於怎麼轉碼呢.... :php只要使用iconv函數即可 :安裝方式http://www.twvbb.com/vbb/showthread.php?t=299 :使用方式http://tw.php.net/iconv :※引述《punpun(小金)》之銘言: ::請問有大大可以分享一下 ::有關Big5和UTF-8編碼文字互相轉換的流程 -- ※發信站:批踢踢實業坊(ptt.cc) ◆From:140.112.249.201 推ileadu:你那兩個繁簡參考檔,最末端是不是少了?>啊?03/3023:39 推ckmarkhsu:金拍謝,真的是漏掉了,感謝提醒Orz...03/3100:29



請為這篇文章評分?