Python decode 非法字符
文章推薦指數: 80 %
簡單紀錄一下docode. >>> a = "你好" >>> a.encode("utf-8").decode("utf-8", "ignore"). decode 的函數原型是decode([encoding], [errors='strict']).
Hello,World!
Home
Categories
Tags
Archives
簡單紀錄一下docode
>>>a="你好"
>>>a.encode("utf-8").decode("utf-8","ignore")
decode的函數原型是
decode([encoding],[errors='strict'])
透過第二個參數控制錯誤處理。
預設的參數是strict,代表遇到非法字符時就會拋出異常。
如果設為"ignore",則會忽略非法字符
如果設為"replace",則會用?取代非法字符
如果設為"xmlcharrefreplace",則會使用XML的字符引用。
不知道為什麼,
在抓網頁的時候,
特別容易遇到不得不使用設定errors來避開非法字符。
參考
python字符串decode中遇到非法字符的问题
http://www.haogongju.net/art/638257
Pythonprint编码转变默认编码
http://developer.51cto.com/art/201003/188233.htm
[Python]-字串編碼錯誤UnicodeDecodeError
http://www.dotblogs.com.tw/chris0920/archive/2010/10/22/18513.aspx
Published
Jul31,2012
Category
Python
Tags
str
8
unicode
8
Contact
延伸文章資訊
- 1Handling encoding and decoding errors in Python
Handling encoding and decoding errors in Python. By John Lekberg on April 03, 2020. This week's b...
- 2Python decode 非法字符
簡單紀錄一下docode. >>> a = "你好" >>> a.encode("utf-8").decode("utf-8", "ignore"). decode 的函數原型是decode([...
- 3UnicodeError雜談之三———快點投靠python3啦啦啦 - iT 邦幫忙
python UnicodeError雜談之三囉唆一下:跟昨天的囉唆一樣, ... self.errors, final) UnicodeDecodeError: 'utf-8' codec c...
- 4codecs — Codec registry and base classes — Python 3.10.7 ...
This module defines base classes for standard Python codecs (encoders and ... The default error h...
- 5Python中解码decode()与编码encode()与错误处理 ... - 博客园
errors may be given to set a different error handling scheme. The default for errors is 'strict' ...