Re: [問題] 請教Big5 和UTF-8 的編碼差異... - 精華區Web_Design
文章推薦指數: 80 %
採用變動大小,中文字使用3 bytes,英文則維持1 byte 因此若轉碼後,資料庫整體會變成1.5 倍大,200MB(Big5) -> 300MB(UTF-8) 2. 批踢踢實業坊 › 精華區betaWeb_Design 關於我們 聯絡資訊 返回上層 作者ckmarkhsu(深藍站長)看板Web_Design標題Re:[問題]請教Big5和UTF-8的編碼差異...時間WedMar2912:44:402006 這網路上有非常多資料:P 簡單來說(以下全部是經驗談) Big5有幾個特色 1.每個中文字使用2bytes 2.因為制定者腦殘,用到了控制碼 所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題 3.延伸字集中,有簡體字但是沒有定義日文字 UTF-8則有以下特色 1.採用變動大小,中文字使用3bytes,英文則維持1byte 因此若轉碼後,資料庫整體會變成1.5倍大,200MB(Big5)->300MB(UTF-8) 2.支援所有語言文字,還有一些怪怪圖形:P 3.簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山" 是同一個UTF-8編碼 至於怎麼轉碼呢.... php只要使用iconv函數即可 安裝方式http://www.twvbb.com/vbb/showthread.php?t=299 使用方式http://tw.php.net/iconv ※引述《punpun(小金)》之銘言: :請問有大大可以分享一下 :有關Big5和UTF-8編碼文字互相轉換的流程 -- ※發信站:批踢踢實業坊(ptt.cc) ◆From:140.112.249.201 →ilovebbs:一般來說,用哪種會比較好啊[email protected]@03/2913:05 →ckmarkhsu:當然是UTF-8阿:P03/2913:27 推gckenny:utf-8+103/2914:04 推ogamenewbie:推b2XD03/2919:37 推ileadu:光靠iconv還做不出來…03/2920:53 推ckmarkhsu:為什麼做不出來?03/2923:56 推ast9869:為什麼做不出來+103/3014:41 →ast9869:UTF8+103/3014:41 推ileadu:比方說,簡體字如何從utf-8轉成big5?03/3016:05 →ileadu:utf-8涵蓋範圍較廣,要是能這樣輕鬆轉換就好了…03/3016:07 推ckmarkhsu:你這有點...那阿拉伯文也沒辦法轉成big5阿Orz....03/3019:34 →ckmarkhsu:且很少人會把簡體的UTF8轉成Big5吧:P03/3019:36 →ckmarkhsu:如果真的要轉,掛個3-party的函數即可:P我有寫:P03/3019:36 推ileadu:有寫還不拿來分享:p03/3019:53 >--------------------------------------------------------------------------< 作者:ckmarkhsu(深藍站長)看板:Web_Design 標題:Re:[問題]請教Big5和UTF-8的編碼差異... 時間:ThuMar3021:28:452006 http://www.twvbb.com/vbb/showthread.php?t=572 剛剛有網友提到,如果是UTF-8編碼下的簡體恐無法轉成Big5... 不過還是有個辦法 我寫的這隻function可以支援UTF-8正體簡體轉換 只要將簡體轉成正體後,再incov即可:) ※引述《ckmarkhsu(深藍站長)》之銘言: :這網路上有非常多資料:P :簡單來說(以下全部是經驗談) :Big5有幾個特色 :1.每個中文字使用2bytes :2.因為制定者腦殘,用到了控制碼 :所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題 :3.延伸字集中,有簡體字但是沒有定義日文字 :UTF-8則有以下特色 :1.採用變動大小,中文字使用3bytes,英文則維持1byte :因此若轉碼後,資料庫整體會變成1.5倍大,200MB(Big5)->300MB(UTF-8) :2.支援所有語言文字,還有一些怪怪圖形:P :3.簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山" :是同一個UTF-8編碼 :至於怎麼轉碼呢.... :php只要使用iconv函數即可 :安裝方式http://www.twvbb.com/vbb/showthread.php?t=299 :使用方式http://tw.php.net/iconv :※引述《punpun(小金)》之銘言: ::請問有大大可以分享一下 ::有關Big5和UTF-8編碼文字互相轉換的流程 -- ※發信站:批踢踢實業坊(ptt.cc) ◆From:140.112.249.201 推ileadu:你那兩個繁簡參考檔,最末端是不是少了?>啊?03/3023:39 推ckmarkhsu:金拍謝,真的是漏掉了,感謝提醒Orz...03/3100:29
延伸文章資訊
- 1javascript 轉碼問題utf-8 轉成big5 - iT 邦幫忙
javascript 轉碼問題utf8 轉成big5. 想請教一下有人知道如何用javascript 轉碼utf-8 轉big5 嗎?? 由於我的網頁必須用asp.net 2005 設計,前端程...
- 2五倍券官網當機亂碼為什麼「滚」出來? - 黑暗執行緒
一樣是UTF8 誤判成BIG5,IE、Edge/Chrome(都是Chromium 核心)、Firefox 出現的亂碼不盡相同,也跟.NET 轉換結果不同。IE 顯示為「甇斗? ? 瘜蝙?」(比.
- 3[java]關於編碼big5及Unicode utf-8 | 菜程式- 點部落
說到平常使用上的編碼之類的問題. 一定要提一下批踢踢的一篇精華區文章. 是在討論編碼big5和utf-8. 如果不知道big5是做什麼的可以參考一下「維基百科 ...
- 4utf-8 big5編碼問題 - iT 邦幫忙
語言為java 開發工具為Eclipse 我的檔案編碼是utf-8-bom 專案環境是ms950 寫進去db要big5. 是否有些文字會變成問號沒辦法寫進去db(像"堃").
- 5Re: [問題] 請教Big5 和UTF-8 的編碼差異... - 精華區Web_Design
採用變動大小,中文字使用3 bytes,英文則維持1 byte 因此若轉碼後,資料庫整體會變成1.5 倍大,200MB(Big5) -> 300MB(UTF-8) 2.