python:unicode問題 - 程式人生
文章推薦指數: 80 %
Downloads/lamp-post.csv", 'r') data = file.readlines() data[0] ... \u7000\u7000\u7000\u6f00\u7300\u7400\u7400\u0900\u3000\u3000\u3000\u3000\ ...
程式人生>python>python:unicode問題
【python】python:unicode問題
阿新••發佈:2020-11-03
我正在嘗試解碼從檔案中提取的字串:file=open("./Downloads/lamp-post.csv",'r')
data=file.readlines()
data[0]
'\xff\xfek\x00e\x00y\x00w\x00o\x00r\x00d\x00\t\x00c\x00o\x00m\x00p\x00e\x00t\x00t\x00t\x00g\x00l\x00l\x00o\x00b\x00a\x00l\x00l\x00\x00M\x00O\x00N\x00T\x00H\x00L\x00Y\x00\x00s\x00e\x00a\x00r\x00c\x00h\x00e\x00s\x00\t\x00d\x00e\x00c\x00\x002\x000\x001\x000\x00\t\x00n\x00o\x00v\x00\x002\x000\x001\x000\x00\t\x00o\x00c\x00t\x00\x002\x000\x001\x000\x00\t\x00s\x00e\x00p\x00\x002\x000\x001\x000\x00\t\x00a\x00u\x00g\x00\X002\X000\X001\X000\X00\t\X00J\X00U\X00L\X00\x002\x000\x001\x000\x00\t\x00j\x00u\x00n\x00\X002\X000\X001\X000\X00\T\X00M\X00A\X00Y\X00\X002\X000\X001\X000\X00\t\X00A\X00P\X00R\X00\X002\X000\X001\X000\X00\T\X00M\X00A\X00R\X00\x002\x000\x001\x000\x00\t\x00f\x00e\x00b\x00\x002\x000\x001\x000\x00\t\x00j\x00a\x00n\x00\x002\x000\x001\x000\x00\t\x00a\x00d\x00\x00s\x00h\x00a\x00r\x00e\x00\t\x00s\x00e\x00a\x00r\x00c\x00h\x00\x00s\x00h\x00a\x00r\x00e\x00\t\x00e\x00s\x00t\x00i\x00m\x00a\x00t\x00e\x00d\x00\x00A\x00V\x00G\x00.\x00\x00c\x00p\x00c\x00\t\x00e\x00x\x00t\x00r\x00a\x00c\x00t\x00e\x00d\x00\x00f\x00r\x00o\x00m\x00\x00w\x00e\x00b\x00\x00p\x00a\x00g\x00e\x00\t\x00l\x00o\x00c\x00a\x00l\x00\x00M\x00O\x00N\x00T\x00H\x00L\x00Y\x00\x00s\x00e\x00a\x00r\x00c\x00h\x00e\x00s\x00\n'新增忽略實際上沒有幫助…在[69]中:日期[2]出【69】:u''u6700\u6100\u7200\u6400\u6500\u6e00\u6000\u6c00\u6100\u6d00\u7000\u7000\u7000\u7000\u6f00\u7300\u7400\u7400\u0900\u3000\u3000\u3000\u3000\u3900\u3900\u3400\u0900\u3800\u3800\u3800\u3800\u3000\u0900\u0900\u3300\u3200\u3000\u3300\u3300\u3900\u3000\u3000\u0900\u3300\u3300\u3300\u3300\u3300\u3300\u3300\u3000U3900\U3000\U0900\U3400\U3800\U3000\U0900\U3500\U3900\U3000\U0900\U3500\U3900\U3000\U3000\U0900\U3700\U3200\U3000\U3000\U0900\U3700\U3200\U3000\U3000\U0900\U3300\U3900\U3000\U3000\U0900\U3300\U3300\U3200\U3000\U3000\U3200\U3600\U3000\U3000\U3000\U0900\U0900\U0900\u0900\u090\U0900\U0900\U0900\U3200\UE00\U3200\UE00\U3100\U3800\U3800\U3400\U3400\U3400\U3800\U3800\U3000\U3000\UU3000\UUUUU'在[70]中:日期[2]解碼(“utf-8”,“替換”)。
————————————————————————————————————————————————————————————————————————————————————————————————————————————————---回溯(最近一次呼叫的最後一次)使用者/oleg/in()/opt/local/lib/python2.5/編碼/utf8.py解碼中(輸入,錯誤)十四15def解碼(輸入,錯誤為“嚴格”):--->16返回codecs.utf-8-u解碼(輸入,錯誤,真的。
十七18-類遞增編碼器(codecs.incrementalencoder):報價:“axes”編解碼器無法編碼字元位置0-87:序號不在範圍(128)在[71]中:
解決辦法
這看起來像是UTF-16資料。
所以嘗試data[0].rstrip("\n").decode("utf-16")
編輯(用於更新):嘗試一次解碼整個檔案,即data=open(...).read()
data.decode("utf-16")
問題是,UTF-16中的換行符是\n\x00“,但使用readlines()將在\n處拆分,為下一行保留\x00“字元。
Bizzarre試圖讓Rpy22.1.9與R2.12.1一起使用,在WindowsXP下使用Python2.6
«上一篇
如何在MacOSX中從終端執行我的python指令碼而無需鍵入完整路徑?下一篇»
相關推薦
python:unicode問題
Pythonunicode問題
Python與MySqlunicode問題
如何在使用PythonSuds的Web服務時修復unicode問題
Unicode問題,在python中正確解碼/編碼字串
python字串unicode問題
python中的Unicode問題
PythonPyodbcUnicode問題
Python中的Unicode問題
PythonPandasCSV匯入/Unicode問題
搜尋
基礎教學
Mysql入門
Sql入門
Android入門
Docker入門
Go語言入門
Ruby程式入門
Python入門
Python進階
Django入門
Python爬蟲入門
新加入文章
延伸文章資訊
- 1python UTF-8转GBK字符编码问题(BOM) - SegmentFault
python去除ufeff、xa0、u3000 不知道为什么,明明是utf-8偏偏会遇到bom的问题, ... 'r', encoding='utf-8') as f: reader = csv...
- 2生活中的資料科學:中選會選舉資料庫 - Medium
我們可以使用Series 的文字處理方法 .str.replace('\u3000', ... 我們運用了Python 的pandas 套件將中選會的選舉資料庫2020 第15 任總統(副總統)...
- 3How to read correctly Japanese characters from a file without ...
I've got the next result in the python prompt for the list. >>> jP ['\ufeffさよなら\u3000夜の教室',]. Is ...
- 4第二十五天Jenkins 之旅: 我的BI 報表Pipeline (5) - iT 邦幫忙
下面程式為範例我寫的Python script,讓我們可以在command line 操作與Mongo 資料 ... _clean_data(text: str) -> str: return ...
- 5Python去除抓取字段中的特殊字符 - 台部落
import re str =' \n \u3000\u30001912年4月10日,號稱“世界工業史上的奇蹟”的 ... Python處理csv文件CSV(Comma-Separated Va...