BOM — Unicode歷史沙石(之一) - I.T. 9 遊戲日誌

文章推薦指數: 80 %
投票人數:10人

如果以2個byte嘅Little Endian編碼方式去將Unicode文字去編碼的話,呢種方法就叫UTF-16LE。

如果用咗Big Endian就叫UTF-16BE。

當然,現實上中其實仲有第三種叫UTF-8可能 ... GetunlimitedaccessOpeninappHomeNotificationsListsStoriesWriteBOM—Unicode歷史沙石(之一)Unicode雖然係電腦界中一大好偉大嘅發明,但一個咁大型嘅project、加上人類語言本身嘅複雜性,少不免到後期先發現有一啲設計原來係幾咁憨居,但卻已經成為歷史嘅一部份。

其中一個就係ByteOrderMark,而呢隻冤魂野鬼大概仲會纏繞多十幾廿年…Unicode編碼的兩(或三)大陣型眾所周知,電腦係以一個byte作為最細嘅定址單位,如同一般人用十進制做運算嘅話,一個數字可以表達0–9共10種可能。

時至今日,基本上1byte都等於8bit,幾乎冇例外,8bit可以表示到2⁸即256種意思。

所以對電腦來講,一個位就係0–255而唔係0–9。

MorefromI.T.9遊戲日誌Follow「IT9,你的資訊真的很有用」你好我就係IT9TrustmeIamIT9//fb@it9gamelog,youtube@it9gamelogLovepodcastsoraudiobooks?Learnonthegowithournewapp.TryKnowableAboutHelpTermsPrivacyGettheMediumappGetstartedI.T.9遊戲日誌793Followers「IT9,你的資訊真的很有用」你好我就係IT9TrustmeIamIT9//fb@it9gamelog,youtube@it9gamelogFollowHelpStatusWritersBlogCareersPrivacyTermsAboutKnowable



請為這篇文章評分?