摘要: 当保存文本文件为UTF-8 BOM时,在内容的开头会多出3个字节 EF BB BF ,它是用来标示这个文档就是UTF-8编码的文档,可以防止文本编辑器编码解释出错。但是多出来的3个字节也会惹些麻烦。例如:<?phpsession_start()/*在session cookie使用前,不能有任何输出,空行空格都不行。*/?> 当将这段代码保存为UTF-8 BOM的文件时,前面的3个标示字节,就会导致出现以下错误: 阅读全文
posted @ 2012-11-03 22:51 一支大熊猫 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 接《学习PHP&MYSQL之——字符编码篇(一)》,这一篇主要学习MySQL乱码形成和字符集设置。 MySQL的字符集转换过程如下图: 这个过程至少存在3个字符集的设置,客户端字符集、连接器字符集、服务器端字符集。其中连接器起到至关重要的作用,具体流程为,客户端向服务器端存数据时,客户端将自身字符集编码的数据发送到连接器,连接器选择一种字符集进行转换,然后再将转换好的字符集转换为服务端字符集,再发送给服务器端存储。当客户端向服务器端取数据时,以上过程相逆。 下图为一种场景: 客户端为GBK编码,连接器为UTF8编码,服务器端也为UTF8编码。当客户端将GBK编码的数据发送到连接器时,连 阅读全文
posted @ 2012-11-03 17:56 一支大熊猫 阅读(1754) 评论(4) 推荐(2) 编辑
摘要: 一、字符编码简介 计算机里,只能用二进制码记录文字、图片、图像、声音等媒体,要想将各式各样的媒体映射为简单的二进制编码(媒体 –> 01),就要将很多01根据多种变化的排列组合来表示这些媒体,这些排列组合的方法就成为了编码,文字、图片、声音都存在各式各样的编码。今天学习一下燕十八PHP公益培训课之——字符编码篇。 1、ASCII 最早的编码——ASCII编码,ASCII编码只能表示键盘上(A-Z、a-z、0-9、+-*/&^%)等不超过127个字符。 1个字节有8位,可以表示256个字符,要表示ASCII码只需要7位就够了,所有最高位始终是0。0000 0000 1111 111 阅读全文
posted @ 2012-11-03 15:35 一支大熊猫 阅读(1575) 评论(2) 推荐(0) 编辑