使用python 将utf-16 转换为utf-8 - AI技术聚合
文章推薦指數: 80 %
原文标题:Convert utf-16 to utf-8 using python我正在尝试使用python 将 ... open(r'D:\_apps\aaa\output\destfile', 'w+b', encoding='utf-8') as ...
使用python将utf-16转换为utf-8
青葱年少
6个月前
python326
原文标题:Convertutf-16toutf-8usingpython
我正在尝试使用python将一个巨大的csv文件从utf-16转换为utf-8格式,下面是代码:
withopen(r'D:\_apps\aaa\output\srcfile,'rb')assource_file:
withopen(r'D:\_apps\aaa\output\destfile,'w+b')asdest_file:
contents=source_file.read()
dest_file.write(contents.decode('utf-16').encode('utf-8'))
但是此代码使用大量内存并因Memoryerror而失败。
请用另一种方法帮助我。
原文链接:https://stackoverflow.com//questions/71508111/convert-utf-16-to-utf-8-using-python
回复
我来回复
hiroprotagonist评论
该回答已被采纳!
一个选项是逐行转换文件:
withopen(r'D:\_apps\aaa\output\srcfile','rb')assource_file,\
open(r'D:\_apps\aaa\output\destfile','w+b')asdest_file:
forlineinsource_file:
dest_file.write(line.decode('utf-16').encode('utf-8'))
或者您可以使用所需的编码打开文件:
withopen(r'D:\_apps\aaa\output\srcfile','rb',encoding='utf-16')assource_file,\
open(r'D:\_apps\aaa\output\destfile','w+b',encoding='utf-8')asdest_file:
forlineinsource_file:
dest_file.write(line)
赞同
6个月前
0条评论
请登录或者注册后回复。
相关问题
如何覆盖我的_getitem_函数?
5个月前
0
58
SettingWithCopyWarning:试图在复制数据的切片副本上设置值
6个月前
0
275
如何从URL保存XML文件并使用Python将XML转换为XSLX?
5个月前
0
54
交叉验证过程后r2分数下降是否正常?(线性回归模型)
7个月前
0
82
使用NetworkX和Python划分图的边
6个月前
0
81
训练用于标记分类的CamelBERT模型
6个月前
0
79
在Pytorch中查找子张量不等于给定张量的索引
6个月前
0
89
使用CSV在一行中写入数据
6个月前
0
218
nn.Parameter上的Torch操作
6个月前
0
66
逆ZCA美白
5个月前
0
52
本站注重文章个人版权,不会主动收集付费或者带有商业版权的文章,如果出现侵权情况只可能是作者后期更改了版权声明,如果出现这种情况请主动联系我们,我们看到会在第一时间删除!本站专注于人工智能高质量优质文章收集,方便各位学者快速找到学习资源,本站收集的文章都会附上文章出处,如果不愿意分享到本平台,我们会第一时间删除!
延伸文章資訊
- 1Decode UTF-8 in Python | Delft Stack
- 2python - decode utf-16 file with bom - splunktool
I have a UTF-16 LE file with BOM. I'd like to flip this file in to UTF-8 without BOM so I can par...
- 3Unicode & Character Encodings in Python: A Painless Guide
Unicode vs UTF-8; Encoding and Decoding in Python 3; Python 3: All-In on Unicode; One Byte, Two B...
- 4Unicode HOWTO — Python 3.10.7 documentation
UTF stands for “Unicode Transformation Format”, and the '8' means that 8-bit values are used in t...
- 5utf-16le[BOM] to utf-8 file solution - GitHub
http://stackoverflow.com/questions/22459020/python-decode-utf-16-file-with-bom. import codecs. en...