在线UTF-8编码解码 - 码工具
文章推薦指數: 80 %
在线UTF-8编码解码,UTF-8代码转换. ... UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。
由Ken Thompson于1992年 ...
在线工具导航
MaTools
首页
在线API
好文
流程图
更多工具
微信关注
在线UTF-8编码解码
代码
全屏
×
将下面代码放到您的网页中:
由KenThompson于1992年创建。
现在已经标准化为RFC3629。
UTF-8用1到6个字节编码UNICODE字符。
用在网页上可以同一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。
UTF-8编码规则
如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的字节数,其余各字节均以10开头。
UTF-8转换表表示如下:Unicode/UCS-4bit数UTF-8byte数备注0000~007F0~70XXXXXXX10080~07FF8~11110XXXXX10XXXXXX20800~FFFF12~161110XXXX10XXXXXX10XXXXXX3基本定义范围:0~FFFF10000~1FFFFF17~2111110XXX10XXXXXX10XXXXXX10XXXXXX4Unicode6.1定义范围:0~10FFFF200000~3FFFFFF22~26111110XX10XXXXXX10XXXXXX10XXXXXX10XXXXXX5说明:此非unicode编码范围,属于UCS-4编码早期的规范UTF-8可以到达6字节序列,可以覆盖到31位元(通用字符集原来的极限)。
尽管如此,2003年11月UTF-8被RFC3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF。
根据规范,这些字节值将无法出现在合法UTF-8序列中4000000~7FFFFFFF27~311111110X10XXXXXX10XXXXXX10XXXXXX10XXXXXX10XXXXXX6
UTF-8优点
UTF-8编码可以通过屏蔽位和移位操作快速读写。
字符串比较时strcmp()和wcscmp()的返回结果相同,因此使排序变得更加容易。
字节FF和FE在UTF-8编码中永远不会出现,因此他们可以用来表明UTF-16或UTF-32文本(见BOM)UTF-8是字节顺序无关的。
它的字节顺序在所有系统中都是一样的,因此它实际上并不需要BOM。
UTF-8缺点
你无法从UNICODE字符数判断出UTF-8文本的字节数,因为UTF-8是一种变长编码它需要用2个字节编码那些用扩展ASCII字符集只需1个字节的字符ISOLatin-1是UNICODE的子集,但不是UTF-8的子集8位字符的UTF-8编码会被email网关过滤,因为internet信息最初设计为7位ASCII码。
因此产生了UTF-7编码。
UTF-8在它的表示中使用值100xxxxx的几率超过50%,而现存的实现如ISO2022,4873,6429,和8859系统,会把它错认为是C1控制码。
因此产生了UTF-7.5编码。
常用APIJava11中文版Java8中文版Python中文版Android中文版Bootstrap4教程jQuery手册Redis教程SQL教程Spring5PHP7.4中文版Hibernate5Nginx教程Bootstrap3教程Linux命令MongoDB教程C++中文版MySQL教程Node.js中文CSS手册Springcloud热门工具gif图制作进制转换Cron生成器时间戳转换科学计算器代码对比/归并传图识字衣服尺码计算Base64编码解码身份证信息查询日期间隔计算传图识色摩斯电码人脸识别手绘图片端口扫描DIY卡通头像图片转pdf图片⇆Base64中文简繁转换
延伸文章資訊
- 1UTF-8编码转换器 - ME2在线工具
在线UTF-8编码转换器,可将中文汉字进行UTF8编码转换,也可将UTF编码字符转换成中文、英文、字母等,非大多数工具转换成的unicode汉字码点。
- 2在线UTF-8编码转换工具 - Json格式化
UTF8在线编码解码工具. 1,可以帮助你把中文转换成UTF-8编码形式,同时也支持把UTF-8编码过的字符还原成中文. 2,将字符串转换为UTF-8形式,解决在网络传输过程中出现的 ...
- 3UTF-8转换工具
UTF-8编码在线转工具可以帮助你把中文转换成UTF-8编码,同时也支持把UTF-8编码过的还原成中文。
- 4編碼Big5轉為UTF8 - 政府資料開放平臺
編碼Big5轉為UTF8 · 一、先將檔案已記事本開啟. 將ods檔案以記事本開啟檔案 · 二、開啟後,點選檔案-另存新檔. 用記事本另存新檔 · 三、於儲存按鈕的左方,選擇UTF-8編碼,再 ...
- 5Day27 Python 基礎- 字符轉編碼操作 - iT 邦幫忙
UTF-8 是一種針對Unicode的可變長度字元編碼,英文字符一樣會依照ASCII碼 ... 首先通過編碼 decode 轉換為 Unicode 編碼; 然後通過解碼 encode 轉換為 U...