Python 读取文件首行多了"\ufeff"字符串 - CSDN博客
文章推薦指數: 80 %
要打开的路径比预期A.txt多了一串字符"\ufeff", 显然无法正确打开文件. 解决方案: 在读取B.txt 时,指定编码方式为"utf-8-sig"即可如下:
Python读取文件首行多了"\ufeff"字符串
hello-alien
于 2019-04-2314:58:01 发布
4939
收藏
3
分类专栏:
Python基础
文章标签:
\ufeff
withopen出错
Python基础
专栏收录该内容
36篇文章
15订阅
订阅专栏
问题背景:python读取B.txt文件时,控制台打印首行正常,但是若是用首行内容打开文本的话,就会报错:
Traceback(mostrecentcalllast):
A
File"E:/pythonproject/multiProcess/test.py",line32,in
延伸:
首行出现的”\ufeff“叫BOM(“ByteOrderMark”)用来声明该文件的编码信息.
”utf-8“是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理,也就会发生类似上边的错误.
“uft-8-sig"中sig全拼为signature也就是"带有签名的utf-8”,因此"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理,与文本内容隔离开,也是我们期望的结果.
参考文献:https://blog.csdn.net/wozaizhe56/article/details/82048645
https://blog.csdn.net/vernice/article/details/46873169
https://blog.csdn.net/dumeichen/article/details/42124121
hello-alien
关注
关注
1
点赞
踩
3
收藏
0
评论
Python读取文件首行多了"\ufeff"字符串
问题背景:python读取B.txt文件时,控制台打印首行正常,但是若是用首行内容打开文本的话,就会报错:Traceback(mostrecentcalllast):AFile"E:/pythonproject/multiProcess/test.py",line32,in<module>withopen("%s.txt"%line...
复制链接
扫一扫
专栏目录
产生\ufeff问题的原因及解决办法
夜空下的凝视
04-28
3万+
今天遇到以下问题:
name=[]
withopen('唐诗宋词.txt','r',encoding='utf-8')asf:
foriinf:
fen=i.split(':')
print(fen[0],fen[1])
iffen[0].strip()=='诗名':
name.append(fen[1].strip())
print(nam...
Python读取txt、csv等文件出现\ufeff、\u202a等非法字符解决方法
鹊踏枝-码农的专栏
07-02
1772
在利用Python读取txt、csv等文件时,有时会出现\ufeff、\u202a等非法字符,其若出现在解析文件路径中,如txt文件中为文件路径的话,通常会出现如下错误:“OSError:[WinError123]文件名、目录名或卷标语法不正确”,不注意非法字符的话,很难解决。
下面给出两种具体的解决方法,如下:
1.将要读取的文件的编码方式由“UTF-8”改为“UTF-8-sig”,示例代码如下:
withopen('keywords.txt',mode="r",encoding='u
参与评论
您还未登录,请先
登录
后发表或查看评论
python中的‘\ufeff‘-ValueError:couldnotconvertstringtofloat:‘\ufeff524.794072‘解决
qq_41968196的博客
06-16
261
用python读取csv文件时,发现不同的数据文件,列表的第一个数都会出现’\ufeff’多余字符(如下图),导致报错无法运行,注意:并不是出现多余空格换行之类的错误,所以用strip()、strip(‘\t’)行不通解决方法:
这是编码问题导致的错误,可以尝试改变编码方式或者手动移除非法字符:path_dir=file.readline().strip(‘\ufeff’)
(直接指定移除这几个字符就行,因为一直是这几个字符),我用的手动移除这些字符已解决(如下图)...
\uFEFF
qianqian的博客
05-18
40
1、问题
今天在做下载Excel文件,解析数据时,遇到一个奇葩问题。
文件格式大致长这样
我们是要解析这个Excel文件,然后用map.get("订单号")这种方式获取每一列的值,结果后面列都能正常获取,只有第一列获取结果为null。
后来控制台打印结果看起来也正常,把打印的结果复制在粘贴到代码里之后发现多了一个\uFEFF符号,也就是要用map.get("\uFEFF订单号")这种方式才能获取到值。
2、分析原因
经过和提供Excel文件的第三方沟通他们的原因:
非法字符:‘\ufeff‘解决方案
谷哥的小弟
08-05
450
IDEA中项目编译时报错:java:非法字符:'\ufeff';图示如下:
错误:非法字符:“\ufeff” Java python
低头学习,抬头看路
12-30
4112
JAVA
IDEA导入开源的项目的时候,非法字符:“\ufeff”,编码问题,这一般这个项目是用eclipse开发的。
主要原因是:Eclipse可以自动把UTF-8+BOM文件转为普通的UTF-8文件
解决办法:UTF-8换成GBK然后再换成UTF-8就好了
方法二:
将这些报错的文件拷贝到一个目录中,然后用notpad++打开,点击工具类上的编码,将以uft8格式编码转为以utf8无BOM格式编码,然后保存,再覆盖idea中对应的文件。
方法三:
将文件用..
错误:非法字符:“\ufeff”
mjiansun的专栏
07-10
1万+
问题原因
一、
导入开源的项目的时候,你可以碰到以上的编码问题,这一般这个项目是用eclipse开发的。
主要原因是:Eclipse可以自动把UTF-8+BOM文件转为普通的UTF-8文件,但AndroidStudio需要重新转一下。
二、
使用python打开txt文件,总是开始出现\ufeff,例如使用下面python代码打开a.txt文件,就会报这个错误
lines=ope...
java:非法字符:‘\ufeff‘解决办法
qq_52978553的博客
04-20
3495
一、问题
复制Java项目到idea中,运行显示java:非法字符:'\ufeff'
二、解决办法
先选择GBK,再换成UTF-8
使用pandas读取csv文件,列名开头出现\ufeff的处理
GengPeng的博客
02-18
306
有时候用pandas的read_csv打开文件的时候看不出什么异常,比如下图
但是一旦使用列名处理数据的时候,就会出现列名错误,但是明明写的没有问题。
例如如下所示
那么这时候就要考虑是否有未显示的格式或者和字符,所以我们打印出列名
可以看到有\ufeff的字符。
通过记事本打开文件,发现文件格式是UTF-8withBOM。
来源百度百科:
UTF-8:以字节为编码单元,它的字节顺序在所有系统中都是一様的,没有字节序的问题,也因此它实际上并不需要BOM(“ByteOrderMark”)。
但是U
\ufeff的解决方法
Major_S的博客
07-08
1189
\ufeff的解决方法
解决方法
str.encode('utf-8').decode('utf-8-sig')
实例
withopen("path.txt","r",encoding="utf-8")asf:#第一步:打开文件
text=f.readline()#第二步:读取文件
print(text)
print(type(text))
text=text.encode('utf-8').decode('ut
python的"\ufeff"
jueji2020的博客
12-26
5334
python的"\ufeff"
当我们读取的文件或者写入文件时有时候会出现"\ufeff"非法字符,这个时候需要改变编码方式‘UTF-8‘为‘UTF-8-sig‘:
"UTF-8"的字节顺序在所有系统中都是一样的,没有字节序的问题,它不需要BOM(“ByteOrderMark”)。
"UTF-8-sig"即UTF-8withBOM需要提供BOM。
...
解决【错误:非法字符:‘\ufeff‘】问题
zmt0104的博客
10-30
1590
解决【非法字符:'\ufeff'】问题
【Java】-非法字符:“\ufeff”解决办法
热门推荐
Arielle-L
08-11
1万+
问题描述:
新引入项目的运行时提示"非法字符:“\ufeff”",项目报错不能运行
出现原因:
编码风格不一致
解决方案:
1、在IDEA右下角,将编码改为GBK,再转为UTF-8,重新启动项目问题解决;
操作步骤:
在IDEA右下角找到UTF-8字样的编码格式设计项,点击选择第一项GBK,然后Convert,等待项目覆盖结束;
将编码格式由GBK重新选择为UTF-8,同样是选择Conver...
python读取文件时出现\ufeff非法字符的处理思路
最新发布
一万年太久,只争朝夕
09-13
262
如下图所示,利用python读取文件后,在对字符串进行处理时,会出现。
交互式命令行的运行结果如下图所示,在图中就可以发现所读取的文件为。
库自动对编码格式进行判断(该库一般是不需要单独安装的)。
编码对文件进行读取,然后判断字符串里面是否存在关键字符。
产生该现象的原因是UTF的编码格式分为。
测试结果如下图所示,返回的结果是布尔类型。
本文目前采用的是一种笨办法,即可按照。
因此,需要先对其进行解码,将。
是没有字节序的问题的,而后者。
是按照二进制流读取文件内容,是。
,是存在字节序的区分的,编码的文件时需要选择。
java:非法字符:‘\ufeff‘解决方法
快乐学习
07-01
2518
在idea里面java:非法字符:'\ufeff'解决方法
Python用Pandas读取文件数据以\ufeff开头
NaotionSY的博客
09-24
259
1.发现问题
今天在用Python处理csv数据文件的时候发现一个问题:
ValueError:timedata'\ufeff20210923'doesnotmatchformat'%Y%m%d'(match)
这个时候如果用pandas的read_csv打开文件阅读是不会直接显示\ufeff,只是和别的数据不对齐:
明显可以看出第0行数据是比其他行数据长度不一致,打印字符串长度知道第一条数据比其他都数据多一个字符,也就是刚才报错中的\ufeff(叫做“零宽无间断间隔”又
Python读取文件错误:非法字符\ufeff解决方法
cekong05011的博客
07-29
918
读取文件时出现如下错误:
解决方案:改变.txt的文件编码格式;
(1)编码格式由UTF-8-BOM格式改为无BOM的UTF-8编码格式,
notepad++中就可以修改;
(2)open文件时,将打开文件的编码改写为‘UTF-8-sig’;
f=open('文件名.txt',encoding='UTF-8-sig')
...
错误:非法字符:'\ufeff'
qq_36317441的博客
12-28
9324
今天运行一个安卓项目的时候出现了这个错误:错误:非法字符:'\ufeff'。
如下图所示:
解决这个问题也很简单,用notepad++打开这个Java文件,然后点击工具栏上的编辑按钮,再点击第二个选项使用UTF-8编码,一定要用第二个,不要用第三个,用第三个会出错的。
如下图所示:
最后,按ctrl+S保存即可,这样问题就解决了。
如果本文对您有所帮助,麻烦点击一下右侧的点赞按钮,谢...
去除\ufeff
anqiuen8050的博客
04-02
174
语言:python
编程工具:pycharm
硬件环境:win1064位
读取文件过程中发现一个问题:已有记事本文件(非空),转码UTF-8,复制到pycharm中,在开始位置打印结果会出现\ufeff,打印代码如下
f=open('new2.txt',encoding='UTF-8')#打开文件,以UTF-8编码
l=[]
forline...
“相关推荐”对你有帮助么?
非常没帮助
没帮助
一般
有帮助
非常有帮助
提交
©️2022CSDN
皮肤主题:鲸
设计师:meimeiellie
返回首页
hello-alien
CSDN认证博客专家
CSDN认证企业博客
码龄13年
暂无认证
194
原创
2343
周排名
3053
总排名
139万+
访问
等级
8011
积分
1万+
粉丝
875
获赞
248
评论
3527
收藏
私信
关注
热门文章
python中小数点后取2位(四舍五入)以及取2位(四舍五不入)的方法总结
229211
Python3中打开文件的方式(Withopen)
197562
正则--re模块:匹配开头/结尾(^/$)
187059
正则---re模块的基础用法(re.match()/单个字符匹配/多个字符匹配)
70492
Python3----接口开发之Restful-API----入门(1)
49272
分类专栏
Python接口开发
付费
26篇
Python自动化测试
付费
34篇
C#基础
18篇
Python基础
36篇
管理类联考
2篇
Linux
18篇
算法
9篇
Docker
8篇
Git
8篇
MySQL&Redis
16篇
C/C++从小白到入门
25篇
正则表达式
5篇
数据处理、分析、可视化
9篇
炫酷小工具
5篇
HTML
4篇
金融知识
2篇
最新评论
C#---第十二课:列表操作的高级用法---FindAll()、Find()、Select()、Where()、Sort()、Exists()
南域夜歌:
黑色背景看着好不习惯啊
C语言基础---15.指针&数组名&数组地址&变量对应的加减法---图解篇
Anonymous47:
整理得太好了(感动到落泪)
爬虫---涨跌停股票池信息----(东方财富)
m0_69241643:
url是不是不行了
Windows端UI自动化---python3+uiautomation框架
hello-alien:
文章开头,我贴的地址错了?
Windows端UI自动化---python3+uiautomation框架
空空_i:
包作者的文档:https://github.com/yinkaisheng/Python-UIAutomation-for-Windows/blob/master/readme_cn.md
您愿意向朋友推荐“博客详情页”吗?
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
C#---第十七课:委托delegate、匿名函数、Lambda函数、事件的使用
C#---第十六课:将函数作为参数传递给函数
C#---第十五课:字典(Dictionary)的相关使用
2022年34篇
2021年34篇
2020年62篇
2019年39篇
2018年57篇
目录
目录
分类专栏
Python接口开发
付费
26篇
Python自动化测试
付费
34篇
C#基础
18篇
Python基础
36篇
管理类联考
2篇
Linux
18篇
算法
9篇
Docker
8篇
Git
8篇
MySQL&Redis
16篇
C/C++从小白到入门
25篇
正则表达式
5篇
数据处理、分析、可视化
9篇
炫酷小工具
5篇
HTML
4篇
金融知识
2篇
目录
评论
被折叠的 条评论
为什么被折叠?
到【灌水乐园】发言
查看更多评论
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
0
抵扣说明:
1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。
余额充值
延伸文章資訊
- 1Python \ufeff - SYmm 微筆記
DictReader(csvfile) for row in rows: location = row['LC'].lower().find(str1) if location >-1: ...
- 2Python 讀取文件首行多了"\ufeff"字符串 - 台部落
要打開的路徑比預期A.txt多了一串字符"\ufeff", 顯然無法正確打開文件. 解決方案: 在讀取B.txt 時,指定編碼方式爲"utf-8-sig"即可如下:
- 3python 字符串轉列表出現ufeff的解決方法 - 程式人生
在學習python從文件中讀取文件,並將文件中的字符串轉化為列表的時候,發現文件頭多了一個\ufeff字符。 這個問題前段時間也遇到過了,同樣是上網搜索了半天才解決, ...
- 4Python CSV — \ufeff 問題- Sharon Peng - Medium
Python CSV — \ufeff 問題. 這個問題已經困擾筆者我蠻多次了,想說記錄下來看能不能加深印象,也希望能幫助遇到相同困難的讀者。 怕讀者不知道下方讀取是什麼樣類型的 ...
- 5Python 读取文件首行多了"\ufeff"字符串 - CSDN博客
要打开的路径比预期A.txt多了一串字符"\ufeff", 显然无法正确打开文件. 解决方案: 在读取B.txt 时,指定编码方式为"utf-8-sig"即可如下: