Python字符串编码转换 - CSDN博客
文章推薦指數: 80 %
字符串编码转换最早的字符串编码是ASCII码,只包括0-9的数字,A-Z和a-z的字母以及空格、制表符等其他符号共256个字符。
随着信息技术的发展, ...
Python字符串编码转换
来自江南的你
于 2019-03-2620:07:00 发布
4045
收藏
16
分类专栏:
Python扩展阅读
文章标签:
Python
编码
版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_41556318/article/details/88828357
版权
Python扩展阅读
专栏收录该内容
102篇文章
119订阅
订阅专栏
字符串编码转换
最早的字符串编码是ASCII码,只包括0-9的数字,A-Z和a-z的字母以及空格、制表符等其他符号共256个字符。
随着信息技术的发展,各国的文字都需要进行编码,因此就出现了GBK/GB2312编码以及UTF-8编码。
在Python3中,默认采用UTF-8编码。
在Python中,有两种常用的字符串类型,一种是str,一种是bytes。
这两种类型的字符串不能拼接在一起使用,如果我们需要在网络上传输或者保存到磁盘上的话,就需要将str转换为bytes。
要实现这个转换,就需要使用encode()方法。
1、encode()
str.encode([encoding="utf-8"][,errors="strict"])
encode(...) S.encode(encoding='utf-8',errors='strict')->bytes EncodeSusingthecodecregisteredforencoding.Defaultencoding is'utf-8'.errorsmaybegiventosetadifferenterror handlingscheme.Defaultis'strict'meaningthatencodingerrorsraise aUnicodeEncodeError.Otherpossiblevaluesare'ignore','replace'and 'xmlcharrefreplace'aswellasanyothernameregisteredwith codecs.register_errorthatcanhandleUnicodeEncodeErrors.
例如:
str1="人生若只如初见"
byte1=str1.encode("GBK")#采用GBK编码进行转换
byte2=str1.encode("utf-8")#采用utf-8编码进行转换
print("原字符串:",str1)
print("GBK转换:",byte1)
print("utf-8转换:",byte2)
>>>
原字符串:人生若只如初见
GBK转换:b'\xc8\xcb\xc9\xfa\xc8\xf4\xd6\xbb\xc8\xe7\xb3\xf5\xbc\xfb'
utf-8转换:b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa5\xe5\x8f\xaa\xe5\xa6\x82\xe5\x88\x9d\xe8\xa7\x81'
2、encode()
bytes.decode([encoding="utf-8"][,errors="strict"])
decode(self,/,encoding='utf-8',errors='strict') Decodethebytesusingthecodecregisteredforencoding. encoding Theencodingwithwhichtodecodethebytes. errors Theerrorhandlingschemetouseforthehandlingofdecodingerrors. Thedefaultis'strict'meaningthatdecodingerrorsraisea UnicodeDecodeError.Otherpossiblevaluesare'ignore'and'replace' aswellasanyothernameregisteredwithcodecs.register_errorthat canhandleUnicodeDecodeErrors.
例如:
str1="人生若只如初见"
byte1=str1.encode("GBK")#采用GBK编码进行转换
byte2=str1.encode("utf-8")#采用utf-8编码进行转换
print("原字符串:",str1)
print("GBK转换:",byte1)
print("utf-8转换:",byte2)
str2=byte1.decode("GBK")#解码
str3=byte2.decode("utf-8")#解码
print("解码后:",str2)
print("解码后:",str3)
>>>
原字符串:人生若只如初见
GBK转换:b'\xc8\xcb\xc9\xfa\xc8\xf4\xd6\xbb\xc8\xe7\xb3\xf5\xbc\xfb'
utf-8转换:b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa5\xe5\x8f\xaa\xe5\xa6\x82\xe5\x88\x9d\xe8\xa7\x81'
解码后:人生若只如初见
解码后:人生若只如初见
需要注意的是,使用什么格式进行编码,就必须使用该格式进行解码。
str1="人生若只如初见"
byte1=str1.encode("GBK")#采用GBK编码进行转换
byte2=str1.encode("utf-8")#采用utf-8编码进行转换
print("原字符串:",str1)
print("GBK转换:",byte1)
print("utf-8转换:",byte2)
str2=byte1.decode("utf-8")#使用错误方法进项解码
print("解码后:",str2)
>>>
原字符串:人生若只如初见
GBK转换:b'\xc8\xcb\xc9\xfa\xc8\xf4\xd6\xbb\xc8\xe7\xb3\xf5\xbc\xfb'
utf-8转换:b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa5\xe5\x8f\xaa\xe5\xa6\x82\xe5\x88\x9d\xe8\xa7\x81'
Traceback(mostrecentcalllast):
File"C:/Users/XiangyangDai/Desktop/1.py",line8,in
随着信息技术的发展,各国的文字都需要进行编码,因此就出现了GBK/GB2312编码以及UTF-8编码。
在Python3中,默认采用UTF-8编码。
在Python中,有两种常用的字符串类型,一种是str,一种是bytes。
这两种类型的...
复制链接
扫一扫
专栏目录
python之字符转换_python学习之字符串转换
weixin_39655160的博客
12-11
606
配置环境:python3.6python编辑器:pycharm代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-defstrcase():"字符串大小写转换"print("演示字符串大小写转换")print("演示字符串s赋值为:'thisisapython'")s='thisisapython'print("...
Python的文件编码的转换
君子以阅川的博客
10-03
873
Python3中的字符转换
参与评论
您还未登录,请先
登录
后发表或查看评论
Python编码格式互相转换
liuchaoqi06的博客
01-10
469
#!/usr/bin/python
#_*_coding:utf-8_*_
importos
importio
importtime
importjson
importre
importjsonpath
importdatetime
importsubprocess
importhashlib
defget_current_highest():
"""获取当前时间戳"""
returnint(time.time())
defget_befor_day(.
python数字类型转换函数_python中的字符数字之间的转换函数
weixin_39985286的博客
11-20
106
int(x[,base])将x转换为一个整数long(x[,base])将x转换为一个长整数float(x)将x转换到一个浮点数complex(real[,imag])创建一个复数str(x)将对象x转换为字符串repr(x)将对象x转换为...
python字符串设置编码_手把手教你:python字符串编码详解
weixin_36360005的博客
02-10
3047
1读写文件:open打开文件,read读取的是str,读取之后需要解码为unicode,用decode()。
write()时,若参数为unicode,需要使用你希望写入的编码进行encode。
如果是其他编码格式的str,需要先用该str的编码进行decode(),转换成unicode后再使用写入的编码进行encode()。
如果直接将unicode写入到文件,那么将使用源代码文件声明的字符编码进行编...
python中文字符串编码转换_Python合集之Python字符串编码转换
weixin_35545176的博客
03-01
3736
最早的字符串编码是美国标准信息交换码,即ASCII码,他仅对10个数字,26个大写英文字母、26个小写英文字母及一些其他符号进行了编码。
ASCII码最多只能表示256个符号,每个符号占一个字节。
随着信息技术的发展,各国文字都需要进行编码,于是出现了GBK、GB2312、UTF-8编码等。
其中GBk和GB2312是我国制定的中文编码标准,使用一个字节表示英文字母,2个字节表示中文字符。
而UTF-8是...
Python-字符串编码
新阿巴阿巴
01-11
1380
1.python中的编码
在最新的Python3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言
Python的字符串类型是str,在内存中以Unicode表示
在网络传输数据,或者保存到磁盘时,需要将数据转换为以字节为单位的bytes
在操作字符串时,我们经常遇到str和bytes的互相转换,为了避免乱码问题,应当始终坚持使用UTF-8编码对str和bytes进行转换
2.ord()、chr()
'''
对于单个字符的编码,Python提供了ord()函数获取字符
Python——字符串转换与处理
yelitoudu的博客
04-23
1434
对给定的字符串进行处理,包括字符串长度计算、大小写转换以及去除字符串前后空格等。
在字符串处理中,经常需要统计字符串的长度、进行大小写转换以及去除字符串前后空格等操作。
例如,在基于关键词的搜索引擎中,要查询关键词是否在文档或者网页中出现,搜索引擎并不需要区分关键词中字符的大小写以及关键词前后的空格等。
这时就需要对字符串进行处理,将其中的大写字符都转换为小写,并剔除字符串开头和结尾处的空格,然后再统一进行字符串匹配。
相关知识
Python标准库提供了一系列关于字符串处理的函数。
本关的小目标是让大家学
Python的字符编码
最新发布
基博的博客
07-09
690
之前一直以为unicode和utf8是对等的,现在才发现utf8算是unicode的中间状态。
在学习网页爬虫时,理解网页数据传输的编码机制是一个基础,不然搞不懂报错
python编码转换
yjp2006的专栏
06-23
1457
主要介绍了python的编码机制,unicode,utf-8,utf-16,GBK,GB2312,ISO-8859-1等编码之间的转换。
常见的编码转换分为以下几种情况:
自动识别字
python编码方式转换
m0_57133702的博客
04-28
125
有时候我们操作文件读写的时候会出现格式不一致而导致乱码。
字符串在python内部的表示是unicode编码,也可以说现在的内存是unicode编码格式,硬盘是utf-8。
平常的数据操作都是先把数据读取到内存中,所以内存中都是unicode编码格式。
所以我们平常在做编码转换时候,通常用unicode作为中间编码。
先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码格式。
decode的作用是将二进制数据解码成unicode编码,如str1.decode
python——字符编码
chenchen5152的博客
12-27
983
1、如何解决乱码的情况```python#文件当初以什么标准编码,打开的时候就以什么标准解码```>2、python解释器版本不同带来的编码差异*由于Python2...实例如下:```pythons='我要坚持学python!'#编码res=s.encode('utf8')print(res,type(res))
python之字符串(str)和编码
TFATS的博客
08-18
1528
pass
PHP字符串转码
Jeson的博客
07-28
1万+
/**
*字符串转码utf-8转换成gbk或者gbk转换成utf-8
*
*@paramString$string需要转码的字符串
*@paramString$toType需要转换的字符编码,默认UTF-8
*
*@returnString返回转码后的字符串
*
*/
functiontransCoding($string,$toType="UTF-8")
{
if($toType=="UTF-8"){
$string=
python字符串(str)和列表(list)的互相转换
热门推荐
roytao2的博客
12-02
50万+
1.str>>>list
str1="12345"
list1=list(str1)
printlist1
str2="123sjhiddhi"
list2=str2.split()#orlist2=str2.split("")
printlist2
str3="www.google.com"
list3=str3.split(".")
prin
一篇文章彻底搞懂Python字符编码方式(中文编码,UTF-8,unicode,gb,gbk,中文乱码,爬虫中文乱码)
m0_58859743的博客
05-11
931
(中文编码,UTF-8,unicode,gb,gbk,中文乱码,爬虫中文乱码,文件读取乱码)
python编码详解_Python字符编码详解
weixin_31807383的博客
02-04
172
知识储备三大核心硬件#所有软件都是运行硬件之上的,与运行软件相关的三大核心硬件为cpu、内存、硬盘,我们需要明确三点#1、软件运行前,软件的代码及其相关数据都是存放于硬盘中的#2、任何软件的启动都是将数据从硬盘中读入内存,然后cpu从内存中取出指令并执行#3、软件运行过程中产生的数据最先都是存放于内存中的,若想永久保存软件产生的数据,则需要将数据由内存写入硬盘文本编辑器读取文件内容的流程#阶段1、...
python中的编码转换
dzdzdzd12347的博客
05-08
530
python中的编码转换十六进制与中文概念十六进制转中文1、要转换的类似\\xe8\\xa7\\xa3,且为字符串2、要转换的类似\xe8\xa7\xa3,且为字符串URL的编码与解码url编码
十六进制与中文
概念
\x开头的编码是十六进制字符,\x后面跟的字符即为十六进制的字符串。
十六进制转中文
1、要转换的类似\xe8\xa7\xa3,且为字符串
info='\\xe8\\xa7\\xa3\\xe6\\x9e\\x84\\xe6\\x89\\xb9\\xe8\\xaf\\x84\\xe6\\x8
python字符串编码/解码
清风拂面
08-23
1495
在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。
使用的语法是在字符串前面加上前缀u。
在Python3中,所有的字符串都是Unicode字符串。
1.字符串编码
encode(encoding='UTF-8',errors='strict')
以encoding指定...
python中字符转化
weixin_40876685的博客
03-28
2525
int(x[,base])将x转换为一个整数
long(x[,base])将x转换为一个长整数
float(x)将x转换到一个浮点数
complex(real[,imag])创建一个复数
str(x)将对象x转换为字符串
repr(x)将对象...
“相关推荐”对你有帮助么?
非常没帮助
没帮助
一般
有帮助
非常有帮助
提交
©️2022CSDN
皮肤主题:数字20
设计师:CSDN官方博客
返回首页
来自江南的你
CSDN认证博客专家
CSDN认证企业博客
码龄5年
暂无认证
353
原创
1万+
周排名
137万+
总排名
210万+
访问
等级
1万+
积分
3333
粉丝
1949
获赞
453
评论
1万+
收藏
私信
关注
热门文章
ASCII码对照表(包括十六进制、十进制和字符)
166887
推荐几个看剧的网站
112186
Tkinter组件详解(十一):Text
88689
Tkinter组件详解(七):Entry
66287
如何把Windows系统安装到U盘随身携带,即插即用!
64590
分类专栏
C++
1篇
大数据
10篇
Git
32篇
计算机二级Python
14篇
Tkinter详解
25篇
Pygame详解
26篇
《零基础入门学习Python》笔记
94篇
Python出错
9篇
Python扩展阅读
102篇
计算机二级Python
14篇
Windows系统
11篇
Movie
1篇
Python入门编程题
5篇
Git与GitHub
32篇
Python进阶实战
15篇
机器学习
6篇
零基础入门学习Java
2篇
零基础入门学习C语言
44篇
数据结构与算法
10篇
最新评论
多重继承的陷阱:钻石继承(菱形继承)问题
weixin_44063383:
太牛了,完全解答了我的疑惑
Tkinter组件详解(十一):Text
TheHealth:
bg背景颜色
bd边框宽度
cursor鼠标放上去的样式
(基础的)
Tkinter组件详解(十一):Text
TheHealth:
@金任愈
Tkinter组件详解(十一):Text
TheHealth:
那可能是类型不对,控件是Text。
或者是插入有问题,Text()前面添一个“tk.”。
Tkinter组件详解(一):Label
TenLun:
Label控件默认就在那,没法改,只能自己算。
您愿意向朋友推荐“博客详情页”吗?
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
类对象与初始化列表
Edge兼容性错误
虚拟机安装macOS系统
2022年1篇
2021年2篇
2020年1篇
2019年195篇
2018年160篇
目录
目录
分类专栏
C++
1篇
大数据
10篇
Git
32篇
计算机二级Python
14篇
Tkinter详解
25篇
Pygame详解
26篇
《零基础入门学习Python》笔记
94篇
Python出错
9篇
Python扩展阅读
102篇
计算机二级Python
14篇
Windows系统
11篇
Movie
1篇
Python入门编程题
5篇
Git与GitHub
32篇
Python进阶实战
15篇
机器学习
6篇
零基础入门学习Java
2篇
零基础入门学习C语言
44篇
数据结构与算法
10篇
目录
评论
被折叠的 条评论
为什么被折叠?
到【灌水乐园】发言
查看更多评论
打赏作者
来自江南的你
你的鼓励将是我创作的最大动力
¥2
¥4
¥6
¥10
¥20
输入1-500的整数
余额支付
(余额:--)
扫码支付
扫码支付:¥2
获取中
扫码支付
您的余额不足,请更换扫码支付或充值
打赏作者
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
0
抵扣说明:
1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。
余额充值
延伸文章資訊
- 1Python中字符串編碼轉換encode編碼和decode解碼詳解
在Python中,有兩種常用的字符串類型,分別為str和bytes。其中,str表示Unicode字符(ASCII或者其他);bytes表示二進位數據(包括編碼的文本)。這兩種類 ...
- 2Python 的Big5 與UTF-8 檔案編碼轉換程式教學 - Office 指南
Big5 與UTF-8 的編碼轉換是在中文資料處理上常見的問題之一,以下介紹如何使用Python 來處理Big5 與UTF-8 編碼的互轉。 Big5 轉UTF-8. Python 的讀取與寫入...
- 3python之分析decode、encode、unicode編碼轉換為漢字
decode函式可以將一個普通字串轉換為unicode物件。decode是將普通字串按照引數中的編碼格式進行解析,然後生成對應的unicode物件,比如在這裡我們程式碼用 ...
- 4python中字串的編碼和解碼 - IT人
可以通過encode進行編碼,其中語法如下:. 對字串進行ASCII編碼(只能轉換數字,英文字母和一些符號). # 方式1: 通過bytes ...
- 5難搞的字串符 - iT 邦幫忙
字符串編碼轉換. 在python3.x 中,默認採用編碼格式為UTF-8 在python 中,有兩種常用的字符串類型,為bytes 和str。str(Unicode字符)、bytes(二進制數據)