python:unicode問題 - 程式人生
文章推薦指數: 80 %
Downloads/lamp-post.csv", 'r') data = file.readlines() data[0] ... \u7000\u7000\u7000\u6f00\u7300\u7400\u7400\u0900\u3000\u3000\u3000\u3000\ ...
程式人生>python>python:unicode問題
【python】python:unicode問題
阿新••發佈:2020-11-03
我正在嘗試解碼從檔案中提取的字串:file=open("./Downloads/lamp-post.csv",'r')
data=file.readlines()
data[0]
'\xff\xfek\x00e\x00y\x00w\x00o\x00r\x00d\x00\t\x00c\x00o\x00m\x00p\x00e\x00t\x00t\x00t\x00g\x00l\x00l\x00o\x00b\x00a\x00l\x00l\x00\x00M\x00O\x00N\x00T\x00H\x00L\x00Y\x00\x00s\x00e\x00a\x00r\x00c\x00h\x00e\x00s\x00\t\x00d\x00e\x00c\x00\x002\x000\x001\x000\x00\t\x00n\x00o\x00v\x00\x002\x000\x001\x000\x00\t\x00o\x00c\x00t\x00\x002\x000\x001\x000\x00\t\x00s\x00e\x00p\x00\x002\x000\x001\x000\x00\t\x00a\x00u\x00g\x00\X002\X000\X001\X000\X00\t\X00J\X00U\X00L\X00\x002\x000\x001\x000\x00\t\x00j\x00u\x00n\x00\X002\X000\X001\X000\X00\T\X00M\X00A\X00Y\X00\X002\X000\X001\X000\X00\t\X00A\X00P\X00R\X00\X002\X000\X001\X000\X00\T\X00M\X00A\X00R\X00\x002\x000\x001\x000\x00\t\x00f\x00e\x00b\x00\x002\x000\x001\x000\x00\t\x00j\x00a\x00n\x00\x002\x000\x001\x000\x00\t\x00a\x00d\x00\x00s\x00h\x00a\x00r\x00e\x00\t\x00s\x00e\x00a\x00r\x00c\x00h\x00\x00s\x00h\x00a\x00r\x00e\x00\t\x00e\x00s\x00t\x00i\x00m\x00a\x00t\x00e\x00d\x00\x00A\x00V\x00G\x00.\x00\x00c\x00p\x00c\x00\t\x00e\x00x\x00t\x00r\x00a\x00c\x00t\x00e\x00d\x00\x00f\x00r\x00o\x00m\x00\x00w\x00e\x00b\x00\x00p\x00a\x00g\x00e\x00\t\x00l\x00o\x00c\x00a\x00l\x00\x00M\x00O\x00N\x00T\x00H\x00L\x00Y\x00\x00s\x00e\x00a\x00r\x00c\x00h\x00e\x00s\x00\n'新增忽略實際上沒有幫助…在[69]中:日期[2]出【69】:u''u6700\u6100\u7200\u6400\u6500\u6e00\u6000\u6c00\u6100\u6d00\u7000\u7000\u7000\u7000\u6f00\u7300\u7400\u7400\u0900\u3000\u3000\u3000\u3000\u3900\u3900\u3400\u0900\u3800\u3800\u3800\u3800\u3000\u0900\u0900\u3300\u3200\u3000\u3300\u3300\u3900\u3000\u3000\u0900\u3300\u3300\u3300\u3300\u3300\u3300\u3300\u3000U3900\U3000\U0900\U3400\U3800\U3000\U0900\U3500\U3900\U3000\U0900\U3500\U3900\U3000\U3000\U0900\U3700\U3200\U3000\U3000\U0900\U3700\U3200\U3000\U3000\U0900\U3300\U3900\U3000\U3000\U0900\U3300\U3300\U3200\U3000\U3000\U3200\U3600\U3000\U3000\U3000\U0900\U0900\U0900\u0900\u090\U0900\U0900\U0900\U3200\UE00\U3200\UE00\U3100\U3800\U3800\U3400\U3400\U3400\U3800\U3800\U3000\U3000\UU3000\UUUUU'在[70]中:日期[2]解碼(“utf-8”,“替換”)。
————————————————————————————————————————————————————————————————————————————————————————————————————————————————---回溯(最近一次呼叫的最後一次)使用者/oleg/in()/opt/local/lib/python2.5/編碼/utf8.py解碼中(輸入,錯誤)十四15def解碼(輸入,錯誤為“嚴格”):--->16返回codecs.utf-8-u解碼(輸入,錯誤,真的。
十七18-類遞增編碼器(codecs.incrementalencoder):報價:“axes”編解碼器無法編碼字元位置0-87:序號不在範圍(128)在[71]中:
解決辦法
這看起來像是UTF-16資料。
所以嘗試data[0].rstrip("\n").decode("utf-16")
編輯(用於更新):嘗試一次解碼整個檔案,即data=open(...).read()
data.decode("utf-16")
問題是,UTF-16中的換行符是\n\x00“,但使用readlines()將在\n處拆分,為下一行保留\x00“字元。
Bizzarre試圖讓Rpy22.1.9與R2.12.1一起使用,在WindowsXP下使用Python2.6
«上一篇
如何在MacOSX中從終端執行我的python指令碼而無需鍵入完整路徑?下一篇»
相關推薦
python:unicode問題
Pythonunicode問題
Python與MySqlunicode問題
如何在使用PythonSuds的Web服務時修復unicode問題
Unicode問題,在python中正確解碼/編碼字串
python字串unicode問題
python中的Unicode問題
PythonPyodbcUnicode問題
Python中的Unicode問題
PythonPandasCSV匯入/Unicode問題
搜尋
基礎教學
Mysql入門
Sql入門
Android入門
Docker入門
Go語言入門
Ruby程式入門
Python入門
Python進階
Django入門
Python爬蟲入門
新加入文章
延伸文章資訊
- 1i want to remove "\ u3000" from documents read with csv
i want to remove "\ u3000" from documents read with csv. 2022-09-15 ... 爬虫的数据中存储到csv文件时出错,Python交...
- 2第二十五天Jenkins 之旅: 我的BI 報表Pipeline (5) - iT 邦幫忙
下面程式為範例我寫的Python script,讓我們可以在command line 操作與Mongo 資料 ... _clean_data(text: str) -> str: return ...
- 3python剔除txt中的空格\u3000
python去除\ufeff、\xa0、\u3000 ... Python去除文件中的空格、Tab键和回车 ... python操作txt文件中数据教程[3]-python读取文件夹中所有txt...
- 4python UTF-8转GBK字符编码问题(BOM) - SegmentFault
python去除ufeff、xa0、u3000 不知道为什么,明明是utf-8偏偏会遇到bom的问题, ... 'r', encoding='utf-8') as f: reader = csv...
- 5python:unicode問題 - 程式人生
Downloads/lamp-post.csv", 'r') data = file.readlines() data[0] ... \u7000\u7000\u7000\u6f00\u7300...