php解决中文截取乱码问题

　　针对截取字符串出现中文乱码问题，网上有很多介绍，也有很多函数，但笔者看着网上的函数，总感觉有点别扭，

　　所以自己动手写了一个防止截取字符串时出现中文乱码的函数。

　　实现的原理还是比较简单，主要是利用ASCII编码和中文编码的二进制范围不一致而把它们区分开来，然后，通过substr()截取字符串的函数实现的。

　　下面给出我写的代码，注意：我这里只针对utf-8编码，其他编码，看官可以自己手动改一下函数，以便支持其他的编码。

<?php
header('content-type:text/html;charset=utf-8;');
$str = '利要a-符e:r ttnx节小-子s区。vh;peh。例t来个oe体字n代gb节看t通c eu是的soS至什tna过码 t;Ie看C实e/,字le A来具8y么a)n=于ndg是r于 0tmt现码 e0ssf8单下s(uo别e的以ieh过aatx和t接要u几这看 nsw Ihrr用字 mgtts上就eg cAei的nwo码e跳h，t编';
/*
*在某篇文章中截取一段字符串，多余的用省略号...表示，并且防止中文乱码
*$param1 string要截取的字符串 $str  注意：这里是utf-8编码
*$param2 int截取字符串的长度 $len  
*返回值 成功返回所要截取的字符串，失败为空
*/
function str($str='',$len=0){
    //检查参数
    if(!is_string($str) || !is_int($len)){
        return '';
    }
    $length = strlen($str);
    if($length <= 0 ){
        return '';
    }
    if($len>=$length){
        return $str;
    }
    //初始化，统计字符串的个数，
    $count = 0;
    for($i=0;$i<$length;$i++){
        //达到个数跳出循环，$i即为要截取的长度
        if($count == $len){
            break;
        }
        $count++;
        //ord函数是获取字符串的ASCII编码，大于等于十六进制0x80的字符串即为中文字符串
        if(ord($str{$i}) >= 0x80){
            $i +=2;//中文编码的字符串的长度再加2
        }
    }
    //如果要截取的个数超过了字符串的总个数，那么我们返回全部字符串，不带省略号
    if($len > $count){
        return $str;
    }else{
        return substr($str,0,$i).'...';
    }
}

　　以上代码的实现就是利用单字节字符的ASCII码小于0x80。至于要跳过几个字节，这要看具体是什么编码。

　　有什么错误，还望指出。

posted @ 2016-11-20 00:15 循环源圈阅读(1014) 评论(0) 编辑收藏举报

刷新页面返回顶部

php解决中文截取乱码问题

公告