utf-8 繁体中文编码表范围是多少 - 百度知道

文章推薦指數: 80 %
投票人數:10人

UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去 ... 百度首页 商城 注册 登录 首页 用户 认证用户 视频作者 知道团队 帮帮团 认证团队 合伙人 企业 媒体 政府 其他组织 商城 法律 手机答题 我的 百度知道 >无分类 utf-8繁体中文编码表范围是多少  我来答 可选中1个或多个下面的关键词,搜索相关资料。

也可直接点“搜索资料”搜索整个问题。

utf-8 繁体中文 编码表 搜索资料 2个回答 #国庆必看# 如何制定自己的宝藏出行计划? wangwei7066 推荐于2017-09-28 · TA获得超过1.9万个赞 知道大有可为答主 回答量:6693 采纳率:54% 帮助的人:853万 我也去答题访问个人页 关注 展开全部 UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。

UTF-8是一种变长字节编码方式。

对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。

UTF-8最多可用到6个字节。

如表:1字节0xxxxxxx2字节110xxxxx10xxxxxx3字节1110xxxx10xxxxxx10xxxxxx4字节11110xxx10xxxxxx10xxxxxx10xxxxxx5字节111110xx10xxxxxx10xxxxxx10xxxxxx10xxxxxx6字节1111110x10xxxxxx10xxxxxx10xxxxxx10xxxxxx10xxxxxx因此UTF-8中可以用来表示字符编码的实际位数最多有31位,即上表中x所表示的位。

除去那些控制位(每字节开头的10等),这些x表示的位与UNICODE编码是一一对应的,位高低顺序也相同。

实际将UNICODE转换为UTF-8编码时应先去除高位0,然后根据所剩编码的位数决定所需最小的UTF-8编码位数。

因此那些基本ASCII字符集中的字符(UNICODE兼容ASCII)只需要一个字节的UTF-8编码(7个二进制位)便可以表示。

对于上面的问题,代码中给出的两个字节是十六进制:C0B1二进制:1100000010110001对比两个字节编码的表示方式:110xxxxx10xxxxxx提取出对应的UNICODE编码:00000110001可以看出此编码并非“标准”的UTF-8编码,因为其第一个字节的“有效编码”全为0,去除高位0后的编码仅有6位。

由前面所述,此字符仅用一个字节的UTF-8编码表示就够了。

JAVA在把字符还原为UTF-8编码时,是按照“标准”的方式处理的,因此我们得到的是仅有1个字节的编码。

大家可以试试运行这段代码:publicclassTestUTF8{publicstaticvoidmain(String[]args)throwsException{byte[][]bytes={//00110001{(byte)0x31},//1100000010110001{(byte)0xC0,(byte)0xB1},//111000001000000010110001{(byte)0xE0,(byte)0x80,(byte)0xB1},//11110000100000001000000010110001{(byte)0xF0,(byte)0x80,(byte)0x80,(byte)0xB1},//1111100010000000100000001000000010110001{(byte)0xF8,(byte)0x80,(byte)0x80,(byte)0x80,(byte)0xB1},//111111001000000010000000100000001000000010110001{(byte)0xFC,(byte)0x80,(byte)0x80,(byte)0x80,(byte)0x80,(byte)0xB1},};for(inti=0;i<6;i++){Stringstr=newString(bytes[i],"UTF-8");System.out.println("原数组长度:"+bytes[i].length+"/t转换为字符串:"+str+"/t转回后数组长度:"+str.getBytes("UTF-8").length);}}}  运行结果为:原数组长度:1转换为字符串:1转回后数组长度:1原数组长度:2转换为字符串:1转回后数组长度:1原数组长度:3转换为字符串:1转回后数组长度:1原数组长度:4转换为字符串:1转回后数组长度:1原数组长度:5转换为字符串:1转回后数组长度:1原数组长度:6转换为字符串:1转回后数组长度:1 已赞过 已踩过< 你对这个回答的评价是? 评论 收起 上海巴鲁图工程机械科技有限公司_ 2022-05-15 广告 增量编码器一般输出信号是两路正交脉冲信号和一路参考信号,之所以叫增量是因为它的位置信号是通过对脉冲计数累加得到,依靠计数设备的内部记忆来记住位置,并且同每圈输出的参考信号来清除累计误差.缺点就是断电后,需要重新寻找初始位置.例如打印机扫描仪的定... 点击进入详情页 本回答由上海巴鲁图工程机械科技有限公司_提供 百度网友c9e795dda 2012-09-26 · TA获得超过5150个赞 知道大有可为答主 回答量:1128 采纳率:0% 帮助的人:869万 我也去答题访问个人页 关注 展开全部 由e38080到e9be98(包括全型符号)第一个中文字则由e4b880起 追问 这个是繁体还是简体,简体是E4B880-E9BEA0 追答 繁体其实这麼理解比较好一点,我说的范围和你说的范围,都是中文字不过你也知道,有些字是繁简一样的.所以其实会有重叠的部份只能说你要的繁体字,并不超出我所说的范围.而你说的简体字,也不超出你说的范围. 本回答被提问者采纳 已赞过 已踩过< 你对这个回答的评价是? 评论 收起 广告您可能关注的内容GEETYPE极字和风字库字体-中日双语正版字体www.geetype.cn查看更多全新全面规范字与繁体字异体字对照表-爱问共享资料爱问共享资料提供50种多种常用文档资料,规范字与繁体字异体字对照表,海量超实用模板等,立即下载!简历模板,工作总结,演讲稿,规范字与繁体字异体..ishare.iask.com广告全新全面常见简体字与繁体字对照表大全1-爱问共享资料爱问共享资料提供50种多种常用文档资料,常见简体字与繁体字对照表大全1,海量超实用模板等,立即下载!简历模板,工作总结,演讲稿,常见简体字与繁..ishare.iask.com广告 其他类似问题 2011-12-12 在utf8字符集中一个中文字符占几个字节 66 2013-08-31 UTF-8编码共收录了多少个汉字? 11 2016-08-16 UTF-8GBKUTF8GB2312Unicode... 13 2017-07-18 java中文乱码问题utf-8和gbk的区别 1 2011-12-17 一个中文字符用utf-8编码占用几个字节,gbk,gb231... 246 2015-07-18 ASCII,Unicode,GBK和UTF-8字符编码的区别... 17 2013-06-01 关于UTF-8编码 2018-06-20 字符「你」的UTF-8编码是多少,请用十六进制表示 4 更多类似问题 > 为你推荐: 特别推荐 赏秋看红叶,如何看到最美风景? 生活中有哪些有趣的冷知识? 美国卫生部为什么大买抗核辐射药? 长沙一女子排出近5米长虫,怎么回事? 等你来答 换一换 帮助更多人 下载百度知道APP,抢鲜体验 使用百度知道APP,立即抢鲜体验。

你的手机镜头里或许有别人想知道的答案。

扫描二维码下载 × 个人、企业类侵权投诉 违法有害信息,请在下方选择后提交 类别 色情低俗 涉嫌违法犯罪 时政信息不实 垃圾广告 低质灌水 我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明 0/200 提交 取消 领取奖励 我的财富值 0 兑换商品 -- 去登录 我的现金 0 提现 下载百度知道APP在APP端-任务中心提现 我知道了 -- 去登录 做任务开宝箱 累计完成 0 个任务 10任务 略略略略… 50任务 略略略略… 100任务 略略略略… 200任务 略略略略… 任务列表加载中... 新手帮助 如何答题 获取采纳 使用财富值 玩法介绍 知道商城 知道团队 帮帮团 合伙人认证 高质量问答 您的帐号状态正常 感谢您对我们的支持 投诉建议 意见反馈 账号申诉 非法信息举报 京ICP证030173号-1   京网文【2013】0934-983号    ©2022Baidu  使用百度前必读 | 知道协议 | 企业推广 辅助 模式



請為這篇文章評分?