在线UTF-8编码解码 - 码工具

文章推薦指數: 80 %
投票人數:10人

在线UTF-8编码解码,UTF-8代码转换. ... UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。

由Ken Thompson于1992年 ... 在线工具导航 MaTools 首页 在线API 好文 流程图 更多工具 微信关注 在线UTF-8编码解码 代码 全屏 × 将下面代码放到您的网页中: 我知道了 URL网址 UTF-8 Unicode ASCII 文字: 支持中文转UTF-8编码,也可以将UTF-8编码还原成中文 编码 解码 Unicode: 工具简介 UTF-8简介 UTF-8(8-bitUnicodeTransformationFormat)是一种针对Unicode的可变长度字符编码,又称万国码。

由KenThompson于1992年创建。

现在已经标准化为RFC3629。

UTF-8用1到6个字节编码UNICODE字符。

用在网页上可以同一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。

UTF-8编码规则 如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的字节数,其余各字节均以10开头。

UTF-8转换表表示如下:Unicode/UCS-4bit数UTF-8byte数备注0000~007F0~70XXXXXXX10080~07FF8~11110XXXXX10XXXXXX20800~FFFF12~161110XXXX10XXXXXX10XXXXXX3基本定义范围:0~FFFF10000~1FFFFF17~2111110XXX10XXXXXX10XXXXXX10XXXXXX4Unicode6.1定义范围:0~10FFFF200000~3FFFFFF22~26111110XX10XXXXXX10XXXXXX10XXXXXX10XXXXXX5说明:此非unicode编码范围,属于UCS-4编码早期的规范UTF-8可以到达6字节序列,可以覆盖到31位元(通用字符集原来的极限)。

尽管如此,2003年11月UTF-8被RFC3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF。

根据规范,这些字节值将无法出现在合法UTF-8序列中4000000~7FFFFFFF27~311111110X10XXXXXX10XXXXXX10XXXXXX10XXXXXX10XXXXXX6 UTF-8优点 UTF-8编码可以通过屏蔽位和移位操作快速读写。

字符串比较时strcmp()和wcscmp()的返回结果相同,因此使排序变得更加容易。

字节FF和FE在UTF-8编码中永远不会出现,因此他们可以用来表明UTF-16或UTF-32文本(见BOM)UTF-8是字节顺序无关的。

它的字节顺序在所有系统中都是一样的,因此它实际上并不需要BOM。

UTF-8缺点 你无法从UNICODE字符数判断出UTF-8文本的字节数,因为UTF-8是一种变长编码它需要用2个字节编码那些用扩展ASCII字符集只需1个字节的字符ISOLatin-1是UNICODE的子集,但不是UTF-8的子集8位字符的UTF-8编码会被email网关过滤,因为internet信息最初设计为7位ASCII码。

因此产生了UTF-7编码。

UTF-8在它的表示中使用值100xxxxx的几率超过50%,而现存的实现如ISO2022,4873,6429,和8859系统,会把它错认为是C1控制码。

因此产生了UTF-7.5编码。

常用APIJava11中文版Java8中文版Python中文版Android中文版Bootstrap4教程jQuery手册Redis教程SQL教程Spring5PHP7.4中文版Hibernate5Nginx教程Bootstrap3教程Linux命令MongoDB教程C++中文版MySQL教程Node.js中文CSS手册Springcloud热门工具gif图制作进制转换Cron生成器时间戳转换科学计算器代码对比/归并传图识字衣服尺码计算Base64编码解码身份证信息查询日期间隔计算传图识色摩斯电码人脸识别手绘图片端口扫描DIY卡通头像图片转pdf图片⇆Base64中文简繁转换



請為這篇文章評分?