(转载)PHP替换包含中文的字符串

要求是一个很普遍的要求,就是把字符串从指定的位置到结束的位置之间的所有字符替换成*。原本以为很简单,但是做起来才发现了问题。

首先想到的是使用strlen获取到字符串长度,再把字符串到做数组处理。事实证明我2了,傻了。
strlen只能获取到字符串的位长度,在gbk编码下一个字符是占2个位,utf-8下占3个位。这样下面这种做法就会乱码了:
$len = strlen($str);
$i = 0;
while ($i < $len) {
      $tmpStr = $str[$i]; //此处会乱码。这里只是取一个位,中文则是2 或者3位。
      ..............
}

 

strlen不能用,自然想到还有mb_strlen等一系列mb函数。研究了下搞定了,代码如下:
function replaceStartFilter($string, $start = 0, $end = 0) {
        $count = mb_strlen($string, 'UTF-8'); //此处传入编码,建议使用utf-8。此处编码要与下面mb_substr()所使用的一致
        if (!$count) {
            return $string;
        }
        if ($end == 0) {
            $end = $count;
        }
 
        $i = 0;
        $returnString = '';
        while ($i < $count) {
            $tmpString = mb_substr($string, $i, 1, 'UTF-8'); // 与mb_strlen编码一致
            if ($start <= $i && $i < $end) {
                $returnString .= '*';
            } else {
                $returnString .= $tmpString;
            }
            $i ++;
        }
        return $returnString;
    }
 
echo replaceStartFilter('王军123网', 0, 2); //王*12网

 

posted @ 2015-08-12 12:48  走在技术不归路  阅读(1085)  评论(0编辑  收藏  举报