PHP学习:字符串操作和正则表达式
主要内容:
- 字符串格式化;
- 用字符串函数连接和分隔字符串;
- 字符串比较;
- 使用字符串函数匹配和替换子字符串;
- 使用正则表达式;
字符串格式化
1,去空格:trim(),ltrim(),rtrim()
trim()函数去掉头尾两边的空格。
ltrim()函数去掉开始的空格。
rtrim()函数去掉结尾的空格。
2,格式化字符串:printf(),sprintf()
printf()函数和sprintf()函数,和echo的功能相同,都会打印字符串。但是它们可以实现更复杂的格式(象C#中string.Format()类似)。
printf()和sprintf()原型如下:
string sprintf(string format[,mixed args..]); void printf(string format[,mixed args...]);sprintf()返回格式化后的字符串。而printf直接将结果输出。它们两个的功能类似,所以就已printf()为例。
$boy = "boy"; echo "i am a $boy"; echo '<br />'; printf("i am a %s",$boy);上面输出的结果一样。
其中format中的类型可以有以下几种:
format中的所有转换类型都以%开始。如果想打印一个“%”符号,必须使用两个“%%”
3,改变字符串中的字符大小写
a).将字符转换为大写:strtoupper()
$str = "i am a boy"; echo strtoupper($str);b).将字符转换为小写 :strtolower()
$str = "I Am A Boy"; echo strtolower($str);c).如果第一个字符是字母,就转换成大写:ucfirst()
$str = "i am a boy"; echo ucfirst($str);d).将字符串中每个单词的第一个字母转成大写:ucwords()
$str = "i am a boy"; echo ucwords($str);4,转义字符串
addslashes()函数就是把“转换成\”,或者把\转成双斜杠\\等等之类的操作。
$str = '"i am a [\] boy."'; echo addslashes($str);输出:\"i am a [\\] boy.\"
addslashes()函数相反的函数就是stripslashes()。
5,编码字符串
htmlspecialchars()函数把&,<,>,“等等,编码成浏览器不能解释的字符。
用字符串函数连接和分隔字符串
1,分隔字符串:explode()
它的原型如下:
array explode(string separator,string input[,int limit]);可以看出返回数组。使用如下:
$str = "1,2,3,4,5"; $arr = explode(',',$str); foreach($arr as $v){ echo $v.'<br />'; }返回1 2 3 4 5
既然有分隔就会有整合。不错,implode()和join()函数实现就是和explode()相反的操作。
$str = "1,2,3,4,5"; $arr = explode(',',$str); echo implode(',',$arr);2,截取字符串:substr()
substr()函数的原型如下:
string substr(string input,int start[,int length]);第二个参数表示截取的开始位置。
第三个参数表示截取的长度。
使用如下:
$str = "i am a boy"; echo substr($str,2);输出:am a boy
需要注意的是,第二个参数和第三个参数可以为负,如果为负,就意味着从后边开始。
function reverse_i($str){ for($i=1;$i<=strlen($str);$i++){ echo substr($str,-$i,1); } return; } reverse_i('word');返回:drow;
字符串比较
1,字符串排序:strcmp(),strcasecmp(),strnatcmp()
strcmp()的原型如下:
int strcmp(string str1,string str2);如果两个字符串相等,返回0;如果按字典顺序str1在str2后面就返回一个正数,反之。这个函数是区分大小写的。
$str1 = "2"; $str2 = "12"; echo strcmp($str1,$str2);返回1,说明它是按字典顺序排列的,$str1的第一个字符大于$str2的第一个字符。
strcasecmp()函数除了不区分大小写之外,其他和strcmp()函数一样。
而strnatcmp()则是按照人们习惯的顺序进行排序。它也不区分大小写。
$str1 = "2"; $str2 = "12"; echo strnatcmp($str1,$str2);返回-1,说明12比2大。
2,获得字符串的长度:strlen()
strlen(“hello”),输出结果为5。
使用字符串函数匹配和替换子字符串
1,在字符串中查找字符串:strstr(),strchr(),strrchr()和strissr()
这些函数看起来张得差不多,真是难记啊!~~
最常用的是strstr()函数,strchr()函数和strstr()函数时一样的,虽然感觉strchr()是查找一个字符的意思。
strstr()函数的原型如下:
string strstr(string haystack,string needle);第一个参数为整个字符串。第二个参数为需要查找的子字符串。
如果找到一个匹配,函数会从needle前面返回haystack,否则返回false。如果存在不止一个needle,返回的字符串从出现第一个needle的位置开始。
a).一个精确匹配
$str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward."; echo strstr($str1,'very');输出:very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.
b).多个匹配
$str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward"; echo strstr($str1,'been');输出:been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.
函数strstr()有两个变体。第一个是stristr()函数,它几乎和strstr()函数一样,但区别就是不区分大小写。
第二个是strrchr()函数,它几乎和strstr()一样,但会从最后出现needle的位置的前面返回字符串haystack。
此函数第二个参数为字符。
$str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward."; echo strrchr($str1,'w');输出:ward.2,查找字符串的位置:strpos(),strrpos()
strpos()函数和strstr()函数的操作类似。但它不是返回一个字符串,而是返回子字符串在整个字符串中的位置。我们平常使用的也是这个。而且比strstr()速度也快。
strpos()函数原型如下:
int strpos(string haystack,string needle,int offset);第三个参数是可选的,标示开始搜索的位置。
$str1 = "hello word"; echo strpos($str1,'o');输出:4,位置是从0开始起。也可以用子字符串,这里只是出于演示目的。
$str1 = "hello word"; echo strpos($str1,'o',5);输出:7。是从位置5开始搜索,也就看不到位置4的那个“o”了。
函数strrpos()也几乎一样,但返回的是子字符串在整个字符串中最后一次出现的位置。
$str1 = "hello word"; echo strrpos($str1,'o');输出:7。说明“o”在hello word中最后一个位置的7。
这里需要注意一下,PHP中的false等于0,如果strpos()或者strrpos()都返回false(没有找到)或者在第一个字符就找到了(第一个字符的起始位置是0),
那么就区分不出来是找到,还是未找到了。那怎么办呢?只能用“===”恒等式来避免这个问题了。
$str1 = "hello word"; $position = strrpos($str1,'h'); //第一个字符就找到了,$position ==0 if($position === false){ echo '没有找到'; }else{ echo $position; }3,替换子字符串:str_replace(),substr_replace()
str_replace()函数的原型如下:
mixed str_replace(mixed needle,mixed new_needle,mixed haystack[,int &count]);第三个参数是可选的。它包含了要执行的替换操作次数。
返回替换过的字符串。
$str1 = "hello word"; echo str_replace('word','china',$str1);输出:hello china
函数substr_replace()则用来在给定位置中查找和替换字符串中特定的子字符串。原型如下:
string substr_replace(string string,string replacement,int start[,int length]);这个函数使用字符串replacement替换整个字符串string中的一部分。具体是那一部分则取决于起始位置和可选参数length的值。
需要注意的是,start的值如果是0或者一个正值,就是从字符串开始计算偏移量;如果是一个负值,就从字符串末尾开始的一个偏移量。
使用正则表达式
1,查找子字符串:ereg(),eregi()
ereg()函数的原型如下:
int ereg(string pattern,string search,array [matches]);在search字符串中查找正则为pattern的表达式,如果发现了与pattern的字表达式相匹配的字符串,这些字符串将会存储在数组matches中,每个数组元素对应一个子表达式。
函数eregi()函数除了不区分大小写外,其功能与ereg()一样。
$str1 = "xxx@gmail.com.cn"; if(!eregi('[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}',$str1)){ echo '不是正确的Email'; }else{ echo '正确'; }2,替换子字符串:ereg_replace(),eregi_replace()
于str_replace()函数一样,只不过这两个使用正则表达式当做参数。
ereg_replace()的原型如下:
string ereg_replace(string pattern,string replacement,string search);$str1 = "123123@gmail.com.cn"; echo ereg_replace('[A-Z0-9._%+-]+@','**@',$str1);函数eregi_replace除了不区分大小写外,其他与ereg_replace()相同。
3,分隔字符串:split()
函数split()的原型如下:
array split(string pattern,string search[,int max]);第三个参数为可选,表示进入数组中的元素个数。
返回值是数组。
$str1 = "123123@gmail.com.cn"; $arr = split('\.|@',$str1); while(list($key,$value) = each($arr)){ echo '<br />'.$key.'--'.$value; }输出:
0--123123
1--gmail
2--com
3--cn
split()函数和explode()函数有点相似,前者是用正则表达式当做分隔符,后者是用字符串当做分隔符。
参考:PHP与MySQL.WEB开发