BOM(字节顺序标记(ByteOrderMark))_百度百科
文章推薦指數: 80 %
BOM —— Byte Order Mark,中文名译作“字节顺序标记”。
在这里找到一段关于BOM 的说明:. 在UCS 编码中有一个叫做"Zero Width No-Break Space" ,中文译名作 ...
百度首页
网页
新闻
贴吧
知道
网盘
图片
视频
地图
文库
百科
首页
历史上的今天
百科冷知识
图解百科
秒懂百科
懂啦
秒懂本尊答
秒懂大师说
秒懂看瓦特
秒懂五千年
秒懂全视界
特色百科
数字博物馆
非遗百科
恐龙百科
多肉百科
艺术百科
科学百科
用户
蝌蚪团
热词团
百科校园
分类达人
百科任务
百科商城
知识专题
权威合作
合作模式
常见问题
联系方式
下载百科APP
个人中心
BOM是一个多义词,请在下列义项上选择浏览(共8个义项)
添加义项
▪韩国女歌手
▪韩国组合BoM
▪描述企业产品组成的技术文件
▪隐藏字符
▪字节顺序标记(ByteOrderMark)
▪英语中的专有名词
▪浏览器对象模型(BrowserObjectModel)
▪物料清单的英文缩写
收藏
查看我的收藏
0
有用+1
已投票
0
BOM
播报
编辑
锁定
讨论
上传视频
特型编辑
字节顺序标记(ByteOrderMark)
本词条缺少概述图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!
BOM(ByteOrderMark),字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码。
中文名
字节顺序标记
外文名
BOM(ByteOrderMark)
实 质
字节顺序标记
详细介绍
详见正文
相关视频查看全部
目录
1
简介
2
不同编码的字节顺序标记的表示
BOM简介
编辑
播报
BOM——ByteOrderMark,中文名译作“字节顺序标记”。
在这里找到一段关于BOM的说明:在UCS编码中有一个叫做"ZeroWidthNo-BreakSpace",中文译名作“零宽无间断间隔”的字符,它的编码是FEFF。
而FEFF在UCS中是不存在的字符,所以不应该出现在实际传输中。
UCS规范建议我们在传输字节流前,先传输字符"ZeroWidthNo-BreakSpace"。
这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little-Endian的。
因此字符"ZeroWidthNo-BreakSpace"(“零宽无间断间隔”)又被称作BOM。
UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。
字符"ZeroWidthNo-BreakSpace"的UTF-8编码是EFBBBF。
所以如果接收者收到以EFBBBF开头的字节流,就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。
字符U+FEFF如果出现在字节流的开头,则用来标识该字节流的字节序,是高位在前还是低位在前。
如果它出现在字节流的中间,则表达零宽度非换行空格的意义,用户看起来就是一个空格。
从Unicode3.2开始,U+FEFF只能出现在字节流的开头,只能用于标识字节序,就如它的名称——字节序标记——所表示的一样;除此以外的用法已被舍弃。
取而代之的是,使用U+2060来表达零宽度无断空白。
类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF0xBB0xBF,即BOM)。
它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。
对于一般的文件,这样并不会产生什么麻烦。
但对于PHP来说,BOM是个大麻烦。
PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,会把BOM作为该文件开头正文的一部分。
根据嵌入式语言的特点,这串字符将被直接执行(显示)出来。
由此造成即使页面的toppadding设置为0,也无法让整个网页紧贴浏览器顶部,因为在html一开头有这3个字符呢!
BOM不同编码的字节顺序标记的表示
编辑
播报
编码表示(十六进制)表示(十进制)UTF-8EFBBBF239187191UTF-16(大端序)FEFF254255UTF-16(小端序)FFFE255254UTF-32(大端序)0000FEFF00254255UTF-32(小端序)FFFE000025525400UTF-72B2F76和以下的一个字节:[38|39|2B|2F]4347118和以下的一个字节:[56|57|43|47]en:UTF-1F7644C24710076en:UTF-EBCDICDD736673221115102115en:StandardCompressionSchemeforUnicode0EFEFF14254255en:BOCU-1FBEE28及可能跟随着FF25123840及可能跟随着255GB-18030843195331324914951
百度百科内容由网友共同编辑,如您发现自己的词条内容不准确或不完善,欢迎使用本人词条编辑服务(免费)参与修正。
立即前往>>
V百科往期回顾
词条统计
浏览次数:次
编辑次数:11次历史版本
最近更新:
鲁勇199
(2020-04-14)
1
简介
2
不同编码的字节顺序标记的表示
为您推荐广告
搜索发现
新手上路
成长任务
编辑入门
编辑规则
本人编辑
我有疑问
内容质疑
在线客服
官方贴吧
意见反馈
投诉建议
举报不良信息
未通过词条申诉
投诉侵权信息
封禁查询与解封
©2022 Baidu 使用百度前必读 | 百科协议 | 隐私政策 | 百度百科合作平台 | 京ICP证030173号
京公网安备11000002000001号
进入词条
清除历史记录关闭
播报
编辑
讨论
收藏
赞
登录
扫码下载百科APP
领取50财富值奖励
分享到微信朋友圈
打开微信“扫一扫”即可将网页分享至朋友圈
选择朗读音色
00:00
00:00
延伸文章資訊
- 1位元組順序記號 - 维基百科
位元組順序記號(英語:byte-order mark,BOM)是位於碼點 U+FEFF 的統一碼字符的名称。當以UTF-16或UTF-32來將UCS/統一碼字符所組成的字串編碼時,這個字符被用來...
- 2UTF-8 BOM (Byte Order Mark) 的問題@新精讚
解釋為甚麼Windows 2000 以後的Notepad 存UTF-8 的檔案會加上BOM(Byte Order Mark, U+FEFF), 主要是因為UTF-8 和ASCII 是相容的, 為...
- 3BOM(字节顺序标记(ByteOrderMark))_百度百科
BOM —— Byte Order Mark,中文名译作“字节顺序标记”。在这里找到一段关于BOM 的说明:. 在UCS 编码中有一个叫做"Zero Width No-Break Space" ...
- 4Byte order mark - Globalization - Microsoft Learn
Byte Order Mark (BOM) is used to indicate how a processor places serialized text into a sequence ...
- 5What is a Byte Order Mark (BOM)? - Definition from Techopedia
The byte order mark (BOM) is a piece of information used to signify that a text file employs Unic...