Python字符串编码转换 - CSDN博客

文章推薦指數: 80 %
投票人數:10人

字符串编码转换最早的字符串编码是ASCII码,只包括0-9的数字,A-Z和a-z的字母以及空格、制表符等其他符号共256个字符。

随着信息技术的发展, ... Python字符串编码转换 来自江南的你 于 2019-03-2620:07:00 发布 4045 收藏 16 分类专栏: Python扩展阅读 文章标签: Python 编码 版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/qq_41556318/article/details/88828357 版权 Python扩展阅读 专栏收录该内容 102篇文章 119订阅 订阅专栏 字符串编码转换 最早的字符串编码是ASCII码,只包括0-9的数字,A-Z和a-z的字母以及空格、制表符等其他符号共256个字符。

随着信息技术的发展,各国的文字都需要进行编码,因此就出现了GBK/GB2312编码以及UTF-8编码。

在Python3中,默认采用UTF-8编码。

在Python中,有两种常用的字符串类型,一种是str,一种是bytes。

这两种类型的字符串不能拼接在一起使用,如果我们需要在网络上传输或者保存到磁盘上的话,就需要将str转换为bytes。

要实现这个转换,就需要使用encode()方法。

1、encode() str.encode([encoding="utf-8"][,errors="strict"]) encode(...)  S.encode(encoding='utf-8',errors='strict')->bytes     EncodeSusingthecodecregisteredforencoding.Defaultencoding  is'utf-8'.errorsmaybegiventosetadifferenterror  handlingscheme.Defaultis'strict'meaningthatencodingerrorsraise  aUnicodeEncodeError.Otherpossiblevaluesare'ignore','replace'and  'xmlcharrefreplace'aswellasanyothernameregisteredwith  codecs.register_errorthatcanhandleUnicodeEncodeErrors. 例如: str1="人生若只如初见" byte1=str1.encode("GBK")#采用GBK编码进行转换 byte2=str1.encode("utf-8")#采用utf-8编码进行转换 print("原字符串:",str1) print("GBK转换:",byte1) print("utf-8转换:",byte2) >>> 原字符串:人生若只如初见 GBK转换:b'\xc8\xcb\xc9\xfa\xc8\xf4\xd6\xbb\xc8\xe7\xb3\xf5\xbc\xfb' utf-8转换:b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa5\xe5\x8f\xaa\xe5\xa6\x82\xe5\x88\x9d\xe8\xa7\x81' 2、encode() bytes.decode([encoding="utf-8"][,errors="strict"]) decode(self,/,encoding='utf-8',errors='strict')  Decodethebytesusingthecodecregisteredforencoding.     encoding   Theencodingwithwhichtodecodethebytes.  errors   Theerrorhandlingschemetouseforthehandlingofdecodingerrors.   Thedefaultis'strict'meaningthatdecodingerrorsraisea   UnicodeDecodeError.Otherpossiblevaluesare'ignore'and'replace'   aswellasanyothernameregisteredwithcodecs.register_errorthat   canhandleUnicodeDecodeErrors. 例如: str1="人生若只如初见" byte1=str1.encode("GBK")#采用GBK编码进行转换 byte2=str1.encode("utf-8")#采用utf-8编码进行转换 print("原字符串:",str1) print("GBK转换:",byte1) print("utf-8转换:",byte2) str2=byte1.decode("GBK")#解码 str3=byte2.decode("utf-8")#解码 print("解码后:",str2) print("解码后:",str3) >>> 原字符串:人生若只如初见 GBK转换:b'\xc8\xcb\xc9\xfa\xc8\xf4\xd6\xbb\xc8\xe7\xb3\xf5\xbc\xfb' utf-8转换:b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa5\xe5\x8f\xaa\xe5\xa6\x82\xe5\x88\x9d\xe8\xa7\x81' 解码后:人生若只如初见 解码后:人生若只如初见 需要注意的是,使用什么格式进行编码,就必须使用该格式进行解码。

str1="人生若只如初见" byte1=str1.encode("GBK")#采用GBK编码进行转换 byte2=str1.encode("utf-8")#采用utf-8编码进行转换 print("原字符串:",str1) print("GBK转换:",byte1) print("utf-8转换:",byte2) str2=byte1.decode("utf-8")#使用错误方法进项解码 print("解码后:",str2) >>> 原字符串:人生若只如初见 GBK转换:b'\xc8\xcb\xc9\xfa\xc8\xf4\xd6\xbb\xc8\xe7\xb3\xf5\xbc\xfb' utf-8转换:b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa5\xe5\x8f\xaa\xe5\xa6\x82\xe5\x88\x9d\xe8\xa7\x81' Traceback(mostrecentcalllast): File"C:/Users/XiangyangDai/Desktop/1.py",line8,in str2=byte1.decode("utf-8")#使用错误方法进项解码 UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0xc8inposition0:invalidcontinuationbyte   来自江南的你 关注 关注 4 点赞 踩 16 收藏 打赏 0 评论 Python字符串编码转换 字符串编码转换最早的字符串编码是ASCII码,只包括0-9的数字,A-Z和a-z的字母以及空格、制表符等其他符号共256个字符。

随着信息技术的发展,各国的文字都需要进行编码,因此就出现了GBK/GB2312编码以及UTF-8编码。

在Python3中,默认采用UTF-8编码。

在Python中,有两种常用的字符串类型,一种是str,一种是bytes。

这两种类型的... 复制链接 扫一扫 专栏目录 python之字符转换_python学习之字符串转换 weixin_39655160的博客 12-11 606 配置环境:python3.6python编辑器:pycharm代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-defstrcase():"字符串大小写转换"print("演示字符串大小写转换")print("演示字符串s赋值为:'thisisapython'")s='thisisapython'print("... Python的文件编码的转换 君子以阅川的博客 10-03 873 Python3中的字符转换 参与评论 您还未登录,请先 登录 后发表或查看评论 Python编码格式互相转换 liuchaoqi06的博客 01-10 469 #!/usr/bin/python #_*_coding:utf-8_*_ importos importio importtime importjson importre importjsonpath importdatetime importsubprocess importhashlib defget_current_highest(): """获取当前时间戳""" returnint(time.time()) defget_befor_day(. python数字类型转换函数_python中的字符数字之间的转换函数 weixin_39985286的博客 11-20 106 int(x[,base])将x转换为一个整数long(x[,base])将x转换为一个长整数float(x)将x转换到一个浮点数complex(real[,imag])创建一个复数str(x)将对象x转换为字符串repr(x)将对象x转换为... python字符串设置编码_手把手教你:python字符串编码详解 weixin_36360005的博客 02-10 3047 1读写文件:open打开文件,read读取的是str,读取之后需要解码为unicode,用decode()。

write()时,若参数为unicode,需要使用你希望写入的编码进行encode。

如果是其他编码格式的str,需要先用该str的编码进行decode(),转换成unicode后再使用写入的编码进行encode()。

如果直接将unicode写入到文件,那么将使用源代码文件声明的字符编码进行编... python中文字符串编码转换_Python合集之Python字符串编码转换 weixin_35545176的博客 03-01 3736 最早的字符串编码是美国标准信息交换码,即ASCII码,他仅对10个数字,26个大写英文字母、26个小写英文字母及一些其他符号进行了编码。

ASCII码最多只能表示256个符号,每个符号占一个字节。

随着信息技术的发展,各国文字都需要进行编码,于是出现了GBK、GB2312、UTF-8编码等。

其中GBk和GB2312是我国制定的中文编码标准,使用一个字节表示英文字母,2个字节表示中文字符。

而UTF-8是... Python-字符串编码 新阿巴阿巴 01-11 1380 1.python中的编码 在最新的Python3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言 Python的字符串类型是str,在内存中以Unicode表示 在网络传输数据,或者保存到磁盘时,需要将数据转换为以字节为单位的bytes 在操作字符串时,我们经常遇到str和bytes的互相转换,为了避免乱码问题,应当始终坚持使用UTF-8编码对str和bytes进行转换 2.ord()、chr() ''' 对于单个字符的编码,Python提供了ord()函数获取字符 Python——字符串转换与处理 yelitoudu的博客 04-23 1434 对给定的字符串进行处理,包括字符串长度计算、大小写转换以及去除字符串前后空格等。

在字符串处理中,经常需要统计字符串的长度、进行大小写转换以及去除字符串前后空格等操作。

例如,在基于关键词的搜索引擎中,要查询关键词是否在文档或者网页中出现,搜索引擎并不需要区分关键词中字符的大小写以及关键词前后的空格等。

这时就需要对字符串进行处理,将其中的大写字符都转换为小写,并剔除字符串开头和结尾处的空格,然后再统一进行字符串匹配。

相关知识 Python标准库提供了一系列关于字符串处理的函数。

本关的小目标是让大家学 Python的字符编码 最新发布 基博的博客 07-09 690 之前一直以为unicode和utf8是对等的,现在才发现utf8算是unicode的中间状态。

在学习网页爬虫时,理解网页数据传输的编码机制是一个基础,不然搞不懂报错 python编码转换 yjp2006的专栏 06-23 1457 主要介绍了python的编码机制,unicode,utf-8,utf-16,GBK,GB2312,ISO-8859-1等编码之间的转换。

常见的编码转换分为以下几种情况: 自动识别字 python编码方式转换 m0_57133702的博客 04-28 125 有时候我们操作文件读写的时候会出现格式不一致而导致乱码。

字符串在python内部的表示是unicode编码,也可以说现在的内存是unicode编码格式,硬盘是utf-8。

平常的数据操作都是先把数据读取到内存中,所以内存中都是unicode编码格式。

所以我们平常在做编码转换时候,通常用unicode作为中间编码。

先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码格式。

decode的作用是将二进制数据解码成unicode编码,如str1.decode python——字符编码 chenchen5152的博客 12-27 983 1、如何解决乱码的情况```python#文件当初以什么标准编码,打开的时候就以什么标准解码```>2、python解释器版本不同带来的编码差异*由于Python2...实例如下:```pythons='我要坚持学python!'#编码res=s.encode('utf8')print(res,type(res)) python之字符串(str)和编码 TFATS的博客 08-18 1528 pass PHP字符串转码 Jeson的博客 07-28 1万+ /** *字符串转码utf-8转换成gbk或者gbk转换成utf-8 * *@paramString$string需要转码的字符串 *@paramString$toType需要转换的字符编码,默认UTF-8 * *@returnString返回转码后的字符串 * */ functiontransCoding($string,$toType="UTF-8") { if($toType=="UTF-8"){ $string= python字符串(str)和列表(list)的互相转换 热门推荐 roytao2的博客 12-02 50万+ 1.str>>>list  str1="12345" list1=list(str1) printlist1 str2="123sjhiddhi" list2=str2.split()#orlist2=str2.split("") printlist2 str3="www.google.com" list3=str3.split(".") prin 一篇文章彻底搞懂Python字符编码方式(中文编码,UTF-8,unicode,gb,gbk,中文乱码,爬虫中文乱码) m0_58859743的博客 05-11 931 (中文编码,UTF-8,unicode,gb,gbk,中文乱码,爬虫中文乱码,文件读取乱码) python编码详解_Python字符编码详解 weixin_31807383的博客 02-04 172 知识储备三大核心硬件#所有软件都是运行硬件之上的,与运行软件相关的三大核心硬件为cpu、内存、硬盘,我们需要明确三点#1、软件运行前,软件的代码及其相关数据都是存放于硬盘中的#2、任何软件的启动都是将数据从硬盘中读入内存,然后cpu从内存中取出指令并执行#3、软件运行过程中产生的数据最先都是存放于内存中的,若想永久保存软件产生的数据,则需要将数据由内存写入硬盘文本编辑器读取文件内容的流程#阶段1、... python中的编码转换 dzdzdzd12347的博客 05-08 530 python中的编码转换十六进制与中文概念十六进制转中文1、要转换的类似\\xe8\\xa7\\xa3,且为字符串2、要转换的类似\xe8\xa7\xa3,且为字符串URL的编码与解码url编码 十六进制与中文 概念 \x开头的编码是十六进制字符,\x后面跟的字符即为十六进制的字符串。

十六进制转中文 1、要转换的类似\xe8\xa7\xa3,且为字符串 info='\\xe8\\xa7\\xa3\\xe6\\x9e\\x84\\xe6\\x89\\xb9\\xe8\\xaf\\x84\\xe6\\x8 python字符串编码/解码 清风拂面 08-23 1495 在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。

使用的语法是在字符串前面加上前缀u。

在Python3中,所有的字符串都是Unicode字符串。

1.字符串编码 encode(encoding='UTF-8',errors='strict') 以encoding指定... python中字符转化 weixin_40876685的博客 03-28 2525 int(x[,base])将x转换为一个整数 long(x[,base])将x转换为一个长整数 float(x)将x转换到一个浮点数 complex(real[,imag])创建一个复数 str(x)将对象x转换为字符串 repr(x)将对象... “相关推荐”对你有帮助么? 非常没帮助 没帮助 一般 有帮助 非常有帮助 提交 ©️2022CSDN 皮肤主题:数字20 设计师:CSDN官方博客 返回首页 来自江南的你 CSDN认证博客专家 CSDN认证企业博客 码龄5年 暂无认证 353 原创 1万+ 周排名 137万+ 总排名 210万+ 访问 等级 1万+ 积分 3333 粉丝 1949 获赞 453 评论 1万+ 收藏 私信 关注 热门文章 ASCII码对照表(包括十六进制、十进制和字符) 166887 推荐几个看剧的网站 112186 Tkinter组件详解(十一):Text 88689 Tkinter组件详解(七):Entry 66287 如何把Windows系统安装到U盘随身携带,即插即用! 64590 分类专栏 C++ 1篇 大数据 10篇 Git 32篇 计算机二级Python 14篇 Tkinter详解 25篇 Pygame详解 26篇 《零基础入门学习Python》笔记 94篇 Python出错 9篇 Python扩展阅读 102篇 计算机二级Python 14篇 Windows系统 11篇 Movie 1篇 Python入门编程题 5篇 Git与GitHub 32篇 Python进阶实战 15篇 机器学习 6篇 零基础入门学习Java 2篇 零基础入门学习C语言 44篇 数据结构与算法 10篇 最新评论 多重继承的陷阱:钻石继承(菱形继承)问题 weixin_44063383: 太牛了,完全解答了我的疑惑 Tkinter组件详解(十一):Text TheHealth: bg背景颜色 bd边框宽度 cursor鼠标放上去的样式 (基础的) Tkinter组件详解(十一):Text TheHealth: @金任愈 Tkinter组件详解(十一):Text TheHealth: 那可能是类型不对,控件是Text。

或者是插入有问题,Text()前面添一个“tk.”。

Tkinter组件详解(一):Label TenLun: Label控件默认就在那,没法改,只能自己算。

您愿意向朋友推荐“博客详情页”吗? 强烈不推荐 不推荐 一般般 推荐 强烈推荐 提交 最新文章 类对象与初始化列表 Edge兼容性错误 虚拟机安装macOS系统 2022年1篇 2021年2篇 2020年1篇 2019年195篇 2018年160篇 目录 目录 分类专栏 C++ 1篇 大数据 10篇 Git 32篇 计算机二级Python 14篇 Tkinter详解 25篇 Pygame详解 26篇 《零基础入门学习Python》笔记 94篇 Python出错 9篇 Python扩展阅读 102篇 计算机二级Python 14篇 Windows系统 11篇 Movie 1篇 Python入门编程题 5篇 Git与GitHub 32篇 Python进阶实战 15篇 机器学习 6篇 零基础入门学习Java 2篇 零基础入门学习C语言 44篇 数据结构与算法 10篇 目录 评论 被折叠的  条评论 为什么被折叠? 到【灌水乐园】发言 查看更多评论 打赏作者 来自江南的你 你的鼓励将是我创作的最大动力 ¥2 ¥4 ¥6 ¥10 ¥20 输入1-500的整数 余额支付 (余额:--) 扫码支付 扫码支付:¥2 获取中 扫码支付 您的余额不足,请更换扫码支付或充值 打赏作者 实付元 使用余额支付 点击重新获取 扫码支付 钱包余额 0 抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。

2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值



請為這篇文章評分?