python 文件读写时用open还是codecs.open - slower - 博客园
文章推薦指數: 80 %
python 文件读写时用open还是codecs.open. 当我面有数据需要保存时,第一时间一般会想到写到一个txt文件中,当然,数据量比较大的时候还是写到数据库 ...
首页
新闻
博问
专区
闪存
班级
我的博客
我的园子
账号设置
简洁模式...
退出登录
注册
登录
python文件读写时用open还是codecs.open
当我面有数据需要保存时,第一时间一般会想到写到一个txt文件中,当然,数据量比较大的时候还是写到数据库比较方便管理,需要进行网络传输时要序列化,json化。
下面主要整理一下平时用的最多的写入到文件中,一般以txt结尾,linux里不会以后缀来区分文件类型,后缀可以随便,也可以没有。
python读写文件估计大家都用open内置函数,或者file这个工厂函数,这两个的效果基本一样。
打开文件的方式一般为:f=open(file_name,access_mode='r',buffering=-1)。
file_name就是文件的路径加文件名字,不加路径则文件会存放在python程序的路径下,
access_mode就是操作文件的模式,主要有r,w,rb,wb等,细节网上一大堆,buffering=-1是用于指示访问文件所采用的缓存方式。
0表示不缓存;1表示只缓存一行,n代表缓存n行。
如果不提供或为负数,则代表使用系统默认的缓存机制。
打开以后就是写和读的操作。
但是用open方法打开会有一些问题。
open打开文件只能写入str类型,不管字符串是什么编码方式。
例如
>>>fr=open('test.txt','a')>>>line1="我爱祖国">>>fr.write(line1)
这样是完全可以的。
但是有时候我们爬虫或者其他方式得到一些数据写入文件时会有编码不统一的问题,所以就一般都统一转换为unicode。
此时写入open方式打开的文件就有问题了。
例如
>>>line2=u'我爱祖国'>>>fr.write(line2)Traceback(mostrecentcalllast): File"
我们要把得到的东西先decode为unicode再encode为str。
。
。
input文件(gbk,utf-8...) ----decode-----> unicode -------encode------>output文件(gbk,utf-8...)
代替这繁琐的操作就是codecs.open,例如
>>>importcodecs>>>fw=codecs.open('test1.txt','a','utf-8')>>>fw.write(line2)>>>
不会报错,说明写入成功。
这种方法可以指定一个编码打开文件,使用这个方法打开的文件读取返回的将是unicode。
写入时,如果参数是unicode,则使用open()时指定的编码进行编码后写入;如果是str,则先根据源代码文件声明的字符编码,解码成unicode后再进行前述操作。
相对内置的open()来说,这个方法比较不容易在编码上出现问题。
总结一下:文件读尽量用第二种方法,一般不会出现编码的问题。
至于用第二种方法有什么缺点,我没有研究过。
。
postedon
2015-09-1323:20
slower
阅读(68210)
评论(4)
编辑
收藏
举报
刷新评论刷新页面返回顶部
延伸文章資訊
- 1Python Codecs Open | Delft Stack
The codecs.open() function works in parallel with the in-built open() function in Python and open...
- 2Python小坑:open()和codecs.open()区别,以及常见指令和 ...
啥也别说了,用codecs.open()就完事了写贴原因因为接触Python时候已经是Python3.x的年代了,用的文件操作最多的就是with open() as file_:这一段话, ...
- 3codecs — Codec registry and base classes — Python 3.10.7 ...
This module defines base classes for standard Python codecs (encoders and decoders) ... codecs. o...
- 4List of open-source codecs - Wikipedia
Video codecsEdit · OpenVVC an VVC /H. · x265 – An encoder based on the High Efficiency Video Codi...
- 5python自然語言編碼轉換模組codecs介紹 - 程式前沿
codecs也提供了方法. 複製程式碼程式碼如下: #-*- encoding: gb2312 -*- import codecs, sys. # 用codecs提供的open ...