utf-8 繁体中文编码表范围是多少 - 百度知道
文章推薦指數: 80 %
UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去 ...
百度首页
商城
注册
登录
首页
用户
认证用户
视频作者
知道团队
帮帮团
认证团队
合伙人
企业
媒体
政府
其他组织
商城
法律
手机答题
我的
百度知道
>无分类
utf-8繁体中文编码表范围是多少
我来答
可选中1个或多个下面的关键词,搜索相关资料。
也可直接点“搜索资料”搜索整个问题。
utf-8
繁体中文
编码表
搜索资料
2个回答
#国庆必看#
如何制定自己的宝藏出行计划?
wangwei7066
推荐于2017-09-28
·
TA获得超过1.9万个赞
知道大有可为答主
回答量:6693
采纳率:54%
帮助的人:853万
我也去答题访问个人页
关注
展开全部
UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。
UTF-8是一种变长字节编码方式。
对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。
UTF-8最多可用到6个字节。
如表:1字节0xxxxxxx2字节110xxxxx10xxxxxx3字节1110xxxx10xxxxxx10xxxxxx4字节11110xxx10xxxxxx10xxxxxx10xxxxxx5字节111110xx10xxxxxx10xxxxxx10xxxxxx10xxxxxx6字节1111110x10xxxxxx10xxxxxx10xxxxxx10xxxxxx10xxxxxx因此UTF-8中可以用来表示字符编码的实际位数最多有31位,即上表中x所表示的位。
除去那些控制位(每字节开头的10等),这些x表示的位与UNICODE编码是一一对应的,位高低顺序也相同。
实际将UNICODE转换为UTF-8编码时应先去除高位0,然后根据所剩编码的位数决定所需最小的UTF-8编码位数。
因此那些基本ASCII字符集中的字符(UNICODE兼容ASCII)只需要一个字节的UTF-8编码(7个二进制位)便可以表示。
对于上面的问题,代码中给出的两个字节是十六进制:C0B1二进制:1100000010110001对比两个字节编码的表示方式:110xxxxx10xxxxxx提取出对应的UNICODE编码:00000110001可以看出此编码并非“标准”的UTF-8编码,因为其第一个字节的“有效编码”全为0,去除高位0后的编码仅有6位。
由前面所述,此字符仅用一个字节的UTF-8编码表示就够了。
JAVA在把字符还原为UTF-8编码时,是按照“标准”的方式处理的,因此我们得到的是仅有1个字节的编码。
大家可以试试运行这段代码:publicclassTestUTF8{publicstaticvoidmain(String[]args)throwsException{byte[][]bytes={//00110001{(byte)0x31},//1100000010110001{(byte)0xC0,(byte)0xB1},//111000001000000010110001{(byte)0xE0,(byte)0x80,(byte)0xB1},//11110000100000001000000010110001{(byte)0xF0,(byte)0x80,(byte)0x80,(byte)0xB1},//1111100010000000100000001000000010110001{(byte)0xF8,(byte)0x80,(byte)0x80,(byte)0x80,(byte)0xB1},//111111001000000010000000100000001000000010110001{(byte)0xFC,(byte)0x80,(byte)0x80,(byte)0x80,(byte)0x80,(byte)0xB1},};for(inti=0;i<6;i++){Stringstr=newString(bytes[i],"UTF-8");System.out.println("原数组长度:"+bytes[i].length+"/t转换为字符串:"+str+"/t转回后数组长度:"+str.getBytes("UTF-8").length);}}} 运行结果为:原数组长度:1转换为字符串:1转回后数组长度:1原数组长度:2转换为字符串:1转回后数组长度:1原数组长度:3转换为字符串:1转回后数组长度:1原数组长度:4转换为字符串:1转回后数组长度:1原数组长度:5转换为字符串:1转回后数组长度:1原数组长度:6转换为字符串:1转回后数组长度:1
已赞过
已踩过<
你对这个回答的评价是?
评论
收起
上海巴鲁图工程机械科技有限公司_
2022-05-15
广告
增量编码器一般输出信号是两路正交脉冲信号和一路参考信号,之所以叫增量是因为它的位置信号是通过对脉冲计数累加得到,依靠计数设备的内部记忆来记住位置,并且同每圈输出的参考信号来清除累计误差.缺点就是断电后,需要重新寻找初始位置.例如打印机扫描仪的定...
点击进入详情页
本回答由上海巴鲁图工程机械科技有限公司_提供
百度网友c9e795dda
2012-09-26
·
TA获得超过5150个赞
知道大有可为答主
回答量:1128
采纳率:0%
帮助的人:869万
我也去答题访问个人页
关注
展开全部
由e38080到e9be98(包括全型符号)第一个中文字则由e4b880起
追问
这个是繁体还是简体,简体是E4B880-E9BEA0
追答
繁体其实这麼理解比较好一点,我说的范围和你说的范围,都是中文字不过你也知道,有些字是繁简一样的.所以其实会有重叠的部份只能说你要的繁体字,并不超出我所说的范围.而你说的简体字,也不超出你说的范围.
本回答被提问者采纳
已赞过
已踩过<
你对这个回答的评价是?
评论
收起
广告您可能关注的内容GEETYPE极字和风字库字体-中日双语正版字体www.geetype.cn查看更多全新全面规范字与繁体字异体字对照表-爱问共享资料爱问共享资料提供50种多种常用文档资料,规范字与繁体字异体字对照表,海量超实用模板等,立即下载!简历模板,工作总结,演讲稿,规范字与繁体字异体..ishare.iask.com广告全新全面常见简体字与繁体字对照表大全1-爱问共享资料爱问共享资料提供50种多种常用文档资料,常见简体字与繁体字对照表大全1,海量超实用模板等,立即下载!简历模板,工作总结,演讲稿,常见简体字与繁..ishare.iask.com广告
其他类似问题
2011-12-12
在utf8字符集中一个中文字符占几个字节
66
2013-08-31
UTF-8编码共收录了多少个汉字?
11
2016-08-16
UTF-8GBKUTF8GB2312Unicode...
13
2017-07-18
java中文乱码问题utf-8和gbk的区别
1
2011-12-17
一个中文字符用utf-8编码占用几个字节,gbk,gb231...
246
2015-07-18
ASCII,Unicode,GBK和UTF-8字符编码的区别...
17
2013-06-01
关于UTF-8编码
2018-06-20
字符「你」的UTF-8编码是多少,请用十六进制表示
4
更多类似问题 >
为你推荐:
特别推荐
赏秋看红叶,如何看到最美风景?
生活中有哪些有趣的冷知识?
美国卫生部为什么大买抗核辐射药?
长沙一女子排出近5米长虫,怎么回事?
等你来答
换一换
帮助更多人
下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。
你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×
个人、企业类侵权投诉
违法有害信息,请在下方选择后提交
类别
色情低俗
涉嫌违法犯罪
时政信息不实
垃圾广告
低质灌水
我们会通过消息、邮箱等方式尽快将举报结果通知您。
说明
0/200
提交
取消
领取奖励
我的财富值
0
兑换商品
--
去登录
我的现金
0
提现
下载百度知道APP在APP端-任务中心提现
我知道了
--
去登录
做任务开宝箱
累计完成
0
个任务
10任务
略略略略…
50任务
略略略略…
100任务
略略略略…
200任务
略略略略…
任务列表加载中...
新手帮助
如何答题
获取采纳
使用财富值
玩法介绍
知道商城
知道团队
帮帮团
合伙人认证
高质量问答
您的帐号状态正常
感谢您对我们的支持
投诉建议
意见反馈
账号申诉
非法信息举报
京ICP证030173号-1 京网文【2013】0934-983号 ©2022Baidu 使用百度前必读 |
知道协议
| 企业推广
辅助
模式
延伸文章資訊
- 1中文在UTF8和GBK編碼中的範圍 - 程式人生
編碼範圍 1. GBK (GB2312/GB18030) x00-xff GBK雙位元組編碼範圍 x20-x7f ASCII xa1-xff 中文 x80-xff 中文. 2. UTF-8 (U...
- 2unicode 或utf8 中文编码范围- xiao913 - 博客园
常被提起中文编码范围[/u4E00-/u9FA5]但随便复制了个韩文下来,或者'お',都不行。然后把范围扩大到^[/u2E80-/u9FFF]+$,这样倒是都通过了, ...
- 3utf8中文编码范围 - 51CTO博客
utf8中文编码范围,UTF-8有点类似于Haffman编码,它将Unicode编码为:00000000-0000007F的字符,用单个字节来表示;00000080-000007FF的字符用两个...
- 4utf-8 繁体中文编码表范围是多少 - 百度知道
UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去 ...
- 5UTF-8 中文编码范围 - CSDN博客
网上一般给出的编码范围:UTF-8 (Unicode) - u4e00-u9fa5 (中文) - x3130-x318F (韩文) - xAC00-xD7A3 (韩文) - u0800-u4e0...