字符编码的常用种类介绍 - CSDN博客

文章推薦指數: 80 %
投票人數:10人

字符编码的常用种类介绍第一种:ASCII码ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套 ... 字符编码的常用种类介绍 fartheway 于 2018-11-0614:31:10 发布 36784 收藏 75 分类专栏: python基础 python基础 专栏收录该内容 6篇文章 1订阅 订阅专栏 字符编码的常用种类介绍 第一种:ASCII码 ASCII(AmericanStandardCodeforInformationInterchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC646。

如下图所示: 由于计算机是美国人发明的,因此,最早只有127个字母被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母a的编码是97。

后128个称为扩展ASCII码。

在这里,每一位0或者1所占的空间单位为bit(比特),这是计算机中最小的表示单位,每8个bit组成一个字符,这是计算机中最小的存储单位。

常见换算单位: bit位,计算机中最小的表示单位 8bit=1bytes字节,最小的存储单位,1bytes缩写为1B 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 第二种:GBK和GB2312 对于我们来说能在计算机中显示中文字符是至关重要的,然而ASCII表里连一个偏旁部首也没有。

所以我们还需要一张关于中文和数字对应的关系表。

一个字节只能最多表示256个字符,要处理中文显然一个字节是不够的,所以我们需要采用两个字节来表示,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。

第三种:Unicode 但如以来,就会出现一个问题,各个国家都一套自己的编码,就不可避免会有冲突,这是该怎么办呢? 因此,Unicode应运而生。

Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。

Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。

现代操作系统和大多数编程语言都直接支持Unicode。

现在,分析一下ASCII编码和Unicode编码的区别: ASCII编码是1个字节,而Unicode编码通常是2个字节。

字母A用ASCII编码是十进制的65,二进制的01000001; 字符0用ASCII编码是十进制的48,二进制的00110000; 汉字“中”已经超出了ASCII编码的范围,用Unicode编码是十进制的20013,二进制的0100111000101101。

如果把ASCII编码的A用Unicode编码,只需要在前面补0就可以,因此,A的Unicode编码是0000000001000001。

但如果统一成Unicode编码,乱码问题从此消失了。

但是,如果你写的文本基本上全部是英文的话,用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。

第四种:UTF-8 基于节约的原则,出现了把Unicode编码转化为“可变长编码”的UTF-8编码。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。

如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间了。

如下所示: 从上面的表格还可以发现,UTF-8编码有一个额外的好处,就是ASCII编码实际上可以被看成是UTF-8编码的一部分,所以,大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

我们总结一下现在计算机系统通用的字符编码工作方式: 在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。

用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件。

如下图: 从http://www.cnblogs.com/schut/p/8406897.html搬运 fartheway 关注 关注 10 点赞 踩 75 收藏 0 评论 字符编码的常用种类介绍 字符编码的常用种类介绍第一种:ASCII码ASCII(AmericanStandardCodeforInformationInterchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC646。

如下图所示:由于计算机是美国人发明的,因此,最早只有127个字母被编码... 复制链接 扫一扫 专栏目录 字符编码之间的关系 qq_33393542的博客 12-26 1177 1、ASCII编码:用来表示英文,它使用1个字节表示,其中第一位规定为0,其他7位存储数据,一共可以表示128个字符。

2、拓展ASCII编码:用于表示更多的欧洲文字,用8个位存储数据,一共可以表示256个字符 3、GBK/GB2312/GB18030:表示汉字。

GBK/GB2312表示简体中文,GB18030表示繁体中文。

4、Unicode编码:包含世界上所有的字符,是一个字符集。

5 常见的字符编码(ASCII码,unicode,utf-8,gbk) cjvhjv的博客 09-01 2578 常见单位换算 bit位计算机的最小表示单位(0,1) bytes字节计算机最小的存储单位,缩写B 1B=8bit 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 字符编码 ASCII码 一个字节表示具体的字符,只用了后七位(2^7=128)最前面的一位统一为0,能够表示128个字符,其中包括了英文字符、阿拉伯数字、西文字符以及 参与评论 您还未登录,请先 登录 后发表或查看评论 几种常见的编码 qq_45309297的博客 11-09 2670 编码 编码是信息从一种形式或格式转换为另一种形式的过程。

解码,是编码的逆过程。

常见的种类有:ASCII、GB2312、GBK、Unicode、UTF-8 ASCII码 计算机内所有的信息最终都是二进制形式。

二进制即0和1,8个二进制即为一个字节,可以有2**8=256种,那么可想而知便是00000000到11111111。

ASCII码总共规定了128个字符的编码,比如大写的字母A是65(二进... 字符编码(ASCII、GBK、UTF-8、ANSI)详解 devilzcl的博客 06-02 3187 目录一、ASCII码二、GB2312、GBK、GB18030、Big5三、Unicode四、ANSI 一、ASCII码 ASCII(AmericanStandardCodeforInformationInterchange)-美国信息交换标准代码 由于计算机最初只支持英文,最先出现的字符编码:ASCII码。

ASCII码采用1个字节编码,共定义了128个字符。

二、GB2312、GBK、GB18030、Big5 随着计算机的不断发展,支持简体中文的字符集包括:GB2312、G 常见字符编码介绍 杰森的博客 03-25 9774 ASCII ASCII是美国(国家)信息交换标准(代)码,一种使用7个或8个二进制位进行编码的方案,最多可以给256(2^80)个字符(包括字母、数字、标点符号、控制字符及其他符号)分配(或指定)数值。

基本的ASCII字符集共有128个字符,其中有96个可打印字符,包括常用的字母、数字、标点符号等,另外还有32个控制字符。

文件中每一个字都是美标形象码或空格码,这类文件称为“美标文本文件”,或略为“文本文件”,通常可在不同电脑系统间直接交换。

文件中含有控制码或非美标码的文件,通常不能在不 字符编码简介 略游 12-29 2856 目录 一、ascii编码 二、扩展ascii编码 三、多字节编码(multibytes) 四、宽字符编码(widechar) 五、unicode编码 六、utf-8编码 七、结语 Python常用字符编码(转) dianwei0041的博客 04-28 72 Python常用字符编码 字符编码的常用种类介绍   第一种:ASCII码     ASCII(AmericanStandardCodeforInformationInterchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC646。

如... 字符编码表 m0_50800862的博客 07-26 290 字符编码表 常见的字符编码 GavinGuo的博客 11-16 2733 一、ASCll码 ASCll128一个英文字母占1个字节 二、BIG5 BIG5 三、GBK GBKGB2312一个汉字占2个字节 四、UNICODE UNICODE2字节(byte) 五、UTF-8 UTF-8可变长编码(汉字三个字节,英文一个字节) 六、编译 编译:把文字翻译为二进制代码;把文本翻译位机器码。

... 一颗糖引发的BUG? JacobSun的博客 04-06 101 我的SQL语句出了点小问题,, ┌BUGBUGBUGBUGBUGBUGBUGBUGBUGBUG┐ select*fromalbum_copywhereinfo='????' 结果是这样的???? select*fromalbum_copywhereinfo='????' >1267-Illegalmixofcollations(utf8_gener... 字符编码详解 weixin_44760675的博客 08-16 252 什么是字符编码? 字符编码是人为的定义的一套转换表。

在字符编码中规定了一系列的文字对应的二进制。

字符编码其实本质上就是一本字典,该字段中描述了文字与二进制之间的对照关系。

字符编码是人为规定的。

(是某个计算机协会规定的。

) ​ 字符编码涉及到编码和解码两个过程,编码和解码的时候必须采用同一套字符编码方式,不然就会出现乱码。

字符编码的发展过程 ​ 起初的时候计算机是不支持文字的,只支持科学计算。

实际上计算机起初是为了 ​ 战争而开发的:计算导弹的轨道… ​ 后来随着计算机的发展,计算机开始支持 字符编码通俗讲解 brk1985的专栏 08-05 1061 先从字符编码讲起。

1、美国人首先对其英文字符进行了编码,也就是最早的ascii码,用一个字节的低7位来表示英文的128个字符,高1位统一为0; 2、后来欧洲人发现尼玛你这128位哪够用,比如我高贵的法国人字母上面的还有注音符,这个怎么区分,得,把高1位编进来吧,这样欧洲普遍使用一个全字节进行编码,最多可表示256位。

欧美人就是喜欢直来直去,字符少,编码用得位数少;  3、但是即使位数少,不 ASCII码编码对照表 最新发布 qq_39511050的博客 09-11 217 ASCII码编码对照表 字符编码方式 weixin_43559498的博客 10-25 1719 一、字符编码方式: 1.ASCII编码:1个字节,8位 2.Unicode编码:2个字节,16位(解决ASCII码位数不够无法表示汉字等问题,即解决乱码问题) 3.UTF-8编码:根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有生僻字才会被编码成4-6个字节(解决Unicode表示字母时的存储空间浪费问题,本着节约精神,出现可变字长编码UTF-8编码,如果传输文本中包含着大量英文字符,用UTF-8编码就能节省空间) 从上面的表格还可以发现,UTF-8编码有一个 字符编码那些事--彻底理解掌握编码知识 liwu的博客 05-04 1万+ 每一个程序员都不可避免的遇到字符编码的问题,很多人在字符编码方面同样遇到不少问题,而且一直对各种编码懵懵懂懂、不清不楚。

这篇文章就是针对字符编码中的一些问题进行了详细的阐述,能从根本上理解字符编码。

浅谈java使用指定字符集编码,以及常见的字符集 weixin_30483013的博客 08-08 445 问题的引入:在InputStreamReader(OutputStreamWriter)的构造方法中,有指定字符集编码,那么什么是字符集?有哪些常用的字符集?怎么用字符集进行编码? 一什么是字符集?   字符:字符(Char)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。

  字符集:字符集(Charset)是多个字符的集合,字符集种类较多,每个字符集包含... 常见的几种编码方式 热门推荐 byf0521hlyp的博客 05-18 5万+ 字符常见的几种编码方式2013年12月05日11:19:32阅读数:45159无论在是在编辑文本文件的时候,还是在制作网页的时候,总会遇到文本编码方式的问题。

如果处理不当,就会出现乱码的问题。

因此,有必要对文本的编码方式做一个详尽的了解。

常见的一些字符编码方式无非有:Unicode、ASCII、GBK... 彻底搞懂计算机中的字符编码 Fromzero 01-14 1408 从0开始学习字符编码 有一些知识你无时无刻不在接触,但是一旦让你回答,可能除了它的名字就回答不上其他什么了,字符编码就是这样,大家都知道UTF-8和GBK,可能还会知道中文字符用GBK的比较多,但是UTF-8不是也支持中文字符吗?为什么我们会用到这两种编码呢,为什么没有统一使用一种?ASCII码也是,最开始计算机基础就有学过它,但还是不知道它和其他编码的关系。

本节,我们就详细的说一说,字符编码。

  一、ASCII码 1.ASCII码的诞生 首先,计算机最终是二进制的,也就是让它表达一下数字, 计算机字符编码 PandaMan~的博客 04-23 983 介绍关于字符编码的内容 字符编码 weixin_44243623的博客 10-23 253 字符 字符分为可见字符和控制字符 1、可见字符 英文字母,数字,标点符号 2、控制字符(不可见字符) 回车,换行 字符集 码位 代表字符 0 空字符 1 标题开始 2 正文开始 … … 31 单元分割符 … … 65 A … … 90 Z … … 127 删除 码位就是一个字符编号,这样的一张表就是字符集。

可见字符一共95个,控制字符一共33个。

ASCAII码表 码位 代表字符 ASCAII码 0 空字符 00000000 1 “相关推荐”对你有帮助么? 非常没帮助 没帮助 一般 有帮助 非常有帮助 提交 ©️2022CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页 fartheway CSDN认证博客专家 CSDN认证企业博客 码龄6年 暂无认证 14 原创 20万+ 周排名 184万+ 总排名 7万+ 访问 等级 544 积分 18 粉丝 36 获赞 2 评论 176 收藏 私信 关注 热门文章 字符编码的常用种类介绍 36781 运行python的四种方法 16228 python-格式化(%,format,f-string)输出+输入 10910 loadrunner11安装 2961 selenium-在新的页面上没法定位元素问题 1215 分类专栏 loadrunner 1篇 python基础 6篇 性能学习 1篇 selenium 4篇 appnium 1篇 linux学习 2篇 最新评论 python中的join和split 失散多年的发际线:   python-格式化(%,format,f-string)输出+输入 rose_zz: 不错 您愿意向朋友推荐“博客详情页”吗? 强烈不推荐 不推荐 一般般 推荐 强烈推荐 提交 最新文章 Linux(三)chmod权限 Mac安装虚拟环境遇到的坑 查看appPackage和appActivity 2019年7篇 2018年9篇 目录 目录 分类专栏 loadrunner 1篇 python基础 6篇 性能学习 1篇 selenium 4篇 appnium 1篇 linux学习 2篇 目录 评论 被折叠的  条评论 为什么被折叠? 到【灌水乐园】发言 查看更多评论 实付元 使用余额支付 点击重新获取 扫码支付 钱包余额 0 抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。

2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值



請為這篇文章評分?