UTF-8空行产生的原因

前不久遇到个很郁闷的问题,页面顶部老是会多出一个空行,一直搞不懂是怎么回事,今天总算找到原因了. UTF-8签名(UTF-8 signature)也叫做BOM(Byte Order Mark),是UTF编码方案里用于标识编码的标准标记。如果多个文件设置了签名,在二进制流中就会包含多个UTF-8签名,而IE是无法识别多个UTF-8签名的,所以用一个空行来代替,在某些程序处理中还会出现一个类似“诺”的字符。 在UCS 编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的编码是 FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输 字符”ZERO WIDTH NO-BREAK SPACE”。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little- Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被称作BOM。 详情: W3C官方关于这个问题的说明:http://www.w3.org/International/questions/qa-utf8-bom 解决方法是去掉UTF-8文件的签名,EditPlus和Dreamweaver中均有相应的选项。以EditPlus为例:进入 Tools->Preferences->Files,在UTF-8 signature选项中选择“Always remove signature”,重新保存文件即可。 如果模板采用包含的方法包含多个utf8文件需要用ultraedit保存时另存为功能,选择utf8 无bom格式保存即可。 另外,如果中文页面在html head标记中将title标记放在前面会导致页面空白。 所以utf8页面应该使用标准顺序

posted on 2009-02-17 19:16  沙加  阅读(1693)  评论(1编辑  收藏  举报

导航