Python 读取文件首行多了"\ufeff"字符串 - CSDN博客

2025-01-10

文章推薦指數： 80 %

投票人數：10人

要打开的路径比预期A.txt多了一串字符"\ufeff", 显然无法正确打开文件. 解决方案：在读取B.txt 时,指定编码方式为"utf-8-sig"即可如下： Python读取文件首行多了"\ufeff"字符串 hello-alien 于 2019-04-2314:58:01 发布 4939 收藏 3 分类专栏： Python基础文章标签： \ufeff withopen出错 Python基础专栏收录该内容 36篇文章 15订阅订阅专栏问题背景：python读取B.txt文件时，控制台打印首行正常，但是若是用首行内容打开文本的话，就会报错： Traceback(mostrecentcalllast): A File"E:/pythonproject/multiProcess/test.py",line32,in withopen("%s.txt"%line,'r',encoding='utf-8')asf1: FileNotFoundError:[Errno2]Nosuchfileordirectory:'\ufeffA.txt' 要打开的路径比预期A.txt多了一串字符"\ufeff",显然无法正确打开文件. 解决方案：在读取B.txt时,指定编码方式为"utf-8-sig"即可如下： withopen("B.txt",'r',encoding='utf-8-sig')asf: line=f.readline()[0:-1]#去掉末尾换行符 print(line) withopen("%s.txt"%line,'r',encoding='utf-8')asf1: print(f1.readline()) f1.close() f.close() 这样f1便可以正常打开,并输出第一行内容。

延伸：首行出现的”\ufeff“叫BOM(“ByteOrderMark”)用来声明该文件的编码信息. ”utf-8“是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理,也就会发生类似上边的错误. “uft-8-sig"中sig全拼为signature也就是"带有签名的utf-8”,因此"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理,与文本内容隔离开,也是我们期望的结果. 参考文献:https://blog.csdn.net/wozaizhe56/article/details/82048645 https://blog.csdn.net/vernice/article/details/46873169 https://blog.csdn.net/dumeichen/article/details/42124121 hello-alien 关注关注 1 点赞踩 3 收藏 0 评论 Python读取文件首行多了"\ufeff"字符串问题背景：python读取B.txt文件时，控制台打印首行正常，但是若是用首行内容打开文本的话，就会报错：Traceback(mostrecentcalllast):AFile"E:/pythonproject/multiProcess/test.py",line32,in<module>withopen("%s.txt"%line... 复制链接扫一扫专栏目录产生\ufeff问题的原因及解决办法夜空下的凝视 04-28 3万+ 今天遇到以下问题： name=[] withopen('唐诗宋词.txt','r',encoding='utf-8')asf: foriinf: fen=i.split(':') print(fen[0],fen[1]) iffen[0].strip()=='诗名': name.append(fen[1].strip()) print(nam... Python读取txt、csv等文件出现\ufeff、\u202a等非法字符解决方法鹊踏枝-码农的专栏 07-02 1772 在利用Python读取txt、csv等文件时，有时会出现\ufeff、\u202a等非法字符，其若出现在解析文件路径中，如txt文件中为文件路径的话，通常会出现如下错误：“OSError:[WinError123]文件名、目录名或卷标语法不正确”，不注意非法字符的话，很难解决。

下面给出两种具体的解决方法，如下： 1.将要读取的文件的编码方式由“UTF-8”改为“UTF-8-sig”，示例代码如下： withopen('keywords.txt',mode="r",encoding='u 参与评论您还未登录，请先登录后发表或查看评论 python中的‘\ufeff‘-ValueError:couldnotconvertstringtofloat:‘\ufeff524.794072‘解决 qq_41968196的博客 06-16 261 用python读取csv文件时，发现不同的数据文件，列表的第一个数都会出现’\ufeff’多余字符（如下图），导致报错无法运行，注意：并不是出现多余空格换行之类的错误，所以用strip()、strip(‘\t’)行不通解决方法：这是编码问题导致的错误，可以尝试改变编码方式或者手动移除非法字符：path_dir=file.readline().strip(‘\ufeff’) (直接指定移除这几个字符就行，因为一直是这几个字符)，我用的手动移除这些字符已解决(如下图)... \uFEFF qianqian的博客 05-18 40 1、问题今天在做下载Excel文件，解析数据时，遇到一个奇葩问题。

文件格式大致长这样我们是要解析这个Excel文件，然后用map.get("订单号")这种方式获取每一列的值，结果后面列都能正常获取，只有第一列获取结果为null。

后来控制台打印结果看起来也正常，把打印的结果复制在粘贴到代码里之后发现多了一个\uFEFF符号，也就是要用map.get("\uFEFF订单号")这种方式才能获取到值。

2、分析原因经过和提供Excel文件的第三方沟通他们的原因：非法字符:‘\ufeff‘解决方案谷哥的小弟 08-05 450 IDEA中项目编译时报错：java:非法字符:'\ufeff'；图示如下：错误：非法字符：“\ufeff”　　Java　python 低头学习，抬头看路 12-30 4112 JAVA IDEA导入开源的项目的时候，非法字符：“\ufeff”，编码问题，这一般这个项目是用eclipse开发的。

主要原因是:Eclipse可以自动把UTF-8+BOM文件转为普通的UTF-8文件解决办法：UTF-8换成GBK然后再换成UTF-8就好了方法二：将这些报错的文件拷贝到一个目录中，然后用notpad++打开，点击工具类上的编码，将以uft8格式编码转为以utf8无BOM格式编码，然后保存，再覆盖idea中对应的文件。

方法三：将文件用.. 错误：非法字符：“\ufeff” mjiansun的专栏 07-10 1万+ 问题原因一、导入开源的项目的时候，你可以碰到以上的编码问题，这一般这个项目是用eclipse开发的。

主要原因是:Eclipse可以自动把UTF-8+BOM文件转为普通的UTF-8文件，但AndroidStudio需要重新转一下。

二、使用python打开txt文件，总是开始出现\ufeff，例如使用下面python代码打开a.txt文件，就会报这个错误 lines=ope... java:非法字符:‘\ufeff‘解决办法 qq_52978553的博客 04-20 3495 一、问题复制Java项目到idea中，运行显示java:非法字符:'\ufeff' 二、解决办法先选择GBK，再换成UTF-8 使用pandas读取csv文件，列名开头出现\ufeff的处理 GengPeng的博客 02-18 306 有时候用pandas的read_csv打开文件的时候看不出什么异常，比如下图但是一旦使用列名处理数据的时候，就会出现列名错误，但是明明写的没有问题。

例如如下所示那么这时候就要考虑是否有未显示的格式或者和字符，所以我们打印出列名可以看到有\ufeff的字符。

通过记事本打开文件，发现文件格式是UTF-8withBOM。

来源百度百科： UTF-8：以字节为编码单元，它的字节顺序在所有系统中都是一様的，没有字节序的问题，也因此它实际上并不需要BOM(“ByteOrderMark”)。

但是U \ufeff的解决方法 Major_S的博客 07-08 1189 \ufeff的解决方法解决方法 str.encode('utf-8').decode('utf-8-sig') 实例 withopen("path.txt","r",encoding="utf-8")asf:#第一步：打开文件 text=f.readline()#第二步：读取文件 print(text) print(type(text)) text=text.encode('utf-8').decode('ut python的"\ufeff" jueji2020的博客 12-26 5334 python的"\ufeff" 当我们读取的文件或者写入文件时有时候会出现"\ufeff"非法字符，这个时候需要改变编码方式‘UTF-8‘为‘UTF-8-sig‘： "UTF-8"的字节顺序在所有系统中都是一样的，没有字节序的问题，它不需要BOM(“ByteOrderMark”)。

"UTF-8-sig"即UTF-8withBOM需要提供BOM。

... 解决【错误:非法字符:‘\ufeff‘】问题 zmt0104的博客 10-30 1590 解决【非法字符：'\ufeff'】问题【Java】-非法字符：“\ufeff”解决办法热门推荐 Arielle-L 08-11 1万+ 问题描述：新引入项目的运行时提示"非法字符：“\ufeff”"，项目报错不能运行出现原因：编码风格不一致解决方案： 1、在IDEA右下角，将编码改为GBK，再转为UTF-8,重新启动项目问题解决；操作步骤：在IDEA右下角找到UTF-8字样的编码格式设计项，点击选择第一项GBK，然后Convert，等待项目覆盖结束；将编码格式由GBK重新选择为UTF-8,同样是选择Conver... python读取文件时出现\ufeff非法字符的处理思路最新发布一万年太久，只争朝夕 09-13 262 如下图所示，利用python读取文件后，在对字符串进行处理时，会出现。

交互式命令行的运行结果如下图所示，在图中就可以发现所读取的文件为。

库自动对编码格式进行判断（该库一般是不需要单独安装的）。

编码对文件进行读取，然后判断字符串里面是否存在关键字符。

产生该现象的原因是UTF的编码格式分为。

测试结果如下图所示，返回的结果是布尔类型。

本文目前采用的是一种笨办法，即可按照。

因此，需要先对其进行解码，将。

是没有字节序的问题的，而后者。

是按照二进制流读取文件内容，是。

，是存在字节序的区分的，编码的文件时需要选择。

java:非法字符:‘\ufeff‘解决方法快乐学习 07-01 2518 在idea里面java:非法字符:'\ufeff'解决方法 Python用Pandas读取文件数据以\ufeff开头 NaotionSY的博客 09-24 259 1.发现问题今天在用Python处理csv数据文件的时候发现一个问题： ValueError:timedata'\ufeff20210923'doesnotmatchformat'%Y%m%d'(match) 这个时候如果用pandas的read_csv打开文件阅读是不会直接显示\ufeff，只是和别的数据不对齐：明显可以看出第0行数据是比其他行数据长度不一致，打印字符串长度知道第一条数据比其他都数据多一个字符，也就是刚才报错中的\ufeff（叫做“零宽无间断间隔”又 Python读取文件错误：非法字符\ufeff解决方法 cekong05011的博客 07-29 918 读取文件时出现如下错误：解决方案：改变.txt的文件编码格式； (1)编码格式由UTF-8-BOM格式改为无BOM的UTF-8编码格式， notepad++中就可以修改； (2)open文件时，将打开文件的编码改写为‘UTF-8-sig’； f=open('文件名.txt',encoding='UTF-8-sig') ... 错误:非法字符:'\ufeff' qq_36317441的博客 12-28 9324 今天运行一个安卓项目的时候出现了这个错误：错误:非法字符:'\ufeff'。

如下图所示：解决这个问题也很简单，用notepad++打开这个Java文件，然后点击工具栏上的编辑按钮，再点击第二个选项使用UTF-8编码，一定要用第二个，不要用第三个，用第三个会出错的。

如下图所示：最后，按ctrl+S保存即可，这样问题就解决了。

如果本文对您有所帮助，麻烦点击一下右侧的点赞按钮，谢... 去除\ufeff anqiuen8050的博客 04-02 174 语言：python 编程工具：pycharm 硬件环境：win1064位读取文件过程中发现一个问题：已有记事本文件（非空），转码UTF-8，复制到pycharm中，在开始位置打印结果会出现\ufeff,打印代码如下 f=open('new2.txt',encoding='UTF-8')#打开文件，以UTF-8编码 l=[] forline... “相关推荐”对你有帮助么？非常没帮助没帮助一般有帮助非常有帮助提交 ©️2022CSDN 皮肤主题：鲸设计师：meimeiellie 返回首页 hello-alien CSDN认证博客专家 CSDN认证企业博客码龄13年暂无认证 194 原创 2343 周排名 3053 总排名 139万+ 访问等级 8011 积分 1万+ 粉丝 875 获赞 248 评论 3527 收藏私信关注热门文章 python中小数点后取2位（四舍五入）以及取2位（四舍五不入）的方法总结 229211 Python3中打开文件的方式（Withopen） 197562 正则--re模块:匹配开头/结尾(^/$) 187059 正则---re模块的基础用法(re.match()/单个字符匹配/多个字符匹配) 70492 Python3----接口开发之Restful-API----入门（1） 49272 分类专栏 Python接口开发付费 26篇 Python自动化测试付费 34篇 C#基础 18篇 Python基础 36篇管理类联考 2篇 Linux 18篇算法 9篇 Docker 8篇 Git 8篇 MySQL&Redis 16篇 C/C++从小白到入门 25篇正则表达式 5篇数据处理、分析、可视化 9篇炫酷小工具 5篇 HTML 4篇金融知识 2篇最新评论 C#---第十二课：列表操作的高级用法---FindAll()、Find()、Select()、Where()、Sort()、Exists() 南域夜歌: 黑色背景看着好不习惯啊 C语言基础---15.指针&数组名&数组地址&变量对应的加减法---图解篇 Anonymous47: 整理得太好了(感动到落泪) 爬虫---涨跌停股票池信息----(东方财富) m0_69241643: url是不是不行了 Windows端UI自动化---python3+uiautomation框架 hello-alien: 文章开头，我贴的地址错了？ Windows端UI自动化---python3+uiautomation框架空空_i: 包作者的文档：https://github.com/yinkaisheng/Python-UIAutomation-for-Windows/blob/master/readme_cn.md 您愿意向朋友推荐“博客详情页”吗？强烈不推荐不推荐一般般推荐强烈推荐提交最新文章 C#---第十七课:委托delegate、匿名函数、Lambda函数、事件的使用 C#---第十六课:将函数作为参数传递给函数 C#---第十五课:字典（Dictionary）的相关使用 2022年34篇 2021年34篇 2020年62篇 2019年39篇 2018年57篇目录目录分类专栏 Python接口开发付费 26篇 Python自动化测试付费 34篇 C#基础 18篇 Python基础 36篇管理类联考 2篇 Linux 18篇算法 9篇 Docker 8篇 Git 8篇 MySQL&Redis 16篇 C/C++从小白到入门 25篇正则表达式 5篇数据处理、分析、可视化 9篇炫酷小工具 5篇 HTML 4篇金融知识 2篇目录评论被折叠的条评论为什么被折叠? 到【灌水乐园】发言查看更多评论实付元使用余额支付点击重新获取扫码支付钱包余额 0 抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。

2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。

余额充值