摘要:
起因:最近遇到一件事情,一个接口能够接收传入编码可能是utf-8,gbk 两种。 做过编码方面转换的同学应该知道的,是什么编码不会在字符串里面有什么标记位的。不过utf-8编码有特殊性,因此可以通过正则表达式来检查。只要发现是utf-8编码。就转换,不是utf-8就当gbk处理。 编码一些常见问题可以查看:由web程序出现乱码开始挖掘(Bom头、字符集与乱码)行动:知道这个原理,马上领任务,开始工作。 想到php版本有个mbstring模块可以进行编码检测转换:问题:问题: 目前编码集合只有这样6个维度:php得到维度代码运行结果: 通过上面6个维度得到得到对应的正则表达式:[\x01-\x7 阅读全文