PHP正则表达式的使用
1. 正则表达式的主要作用是:分割、匹配、查找、替换
2. 正则表达式中包括的元素:原子(普通字符:a-z A-Z 0-9 、原子表、转义字符),元字符(有特殊功能的字符),模式修正符(系统内置部分字符 i 、m、S、U…)
3. 转义字符:\d包含所有数字[0-9],\D除所有数字外[^0-9],\w包含所有字符(大小写英文字母、下划线、数字) [a-zA-Z_0-9],\W除所有字符(大小写英文字母、下划线、数字)外 [^a-zA-Z_0-9],\s包含空白区域如回车、换行、分页等 [\f\n\r]。
4. * 匹配任意次;+ 匹配1次或多次;?匹配0次或1次;.匹配任意次但不包含回车换行;|选择匹配(或者);^匹配开头(方括号中表示非);$匹配尾部;{m}匹配前一个内容的重复次数为m次;{m,}匹配前一个内容的重复次数大于等于m次;{m,n}匹配前一个内容的重复次数m次到n次;( ) 合并整体匹配,并放入内存,可使用\1 \2…依次获取。
5. 模式修正符: 【/正则/U 】 小写i:不区分大小写;小写m:匹配首内容或尾内容时采用多行识别匹配;小写s:将转义回车取消视为单行匹配;小写x:忽略正则中的空白;大写A:强制从头开始匹配;大写D:强制$匹配尾部无任何内容;大写U:禁止贪婪匹配,只跟踪到最近的一个匹配符并结束,常用在采集程序。
6. Perl正则表达式函数:
① preg_grep($mode,$str) //匹配查找,返回一个数组;
② preg_match($mode,$str,$return) //在字符串中查找匹配项,返回一个数组。
③ preg_match_all($mode,$str,$return [,int flags])
④ preg_split($mode,$str [,int limit 切割多少次 [,int flags] ] ) //使用正则表达式分割字符串,并将结果以数组的形式返回(类似explode)。
⑤ preg_replace($mode,$replacement,$str [,int limit 匹配多少次]) //查找和替换子字符串(类似str_replace)
⑥ preg_quote($str) //在每个正则表达式的特殊字符前面加入一个转义字符(反斜线“\”),正则表达式的特殊字符包括:.\\+*?[^]$(){}=!<>|:
◆ 【经典收藏的正则表达式】:
1.删除一对中括号内的内容:$str = "abc[url]123[/url]"; $str = preg_replace('/\[url\S*\[\/url\]/', '', $str); echo $str; //输出:abc123
2.匹配网页源代码中的图片路径:$pattern="/<[img|IMG].*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/"; preg_match_all($pattern,$str,$match); //$match[1][0]就是图片的路径
3.获取当前页面的所有超链接:$pat = '/<a(.*?)href="(.*?)"(.*?)>(.*?)<\/a>/i'; preg_match_all($pat, $str, $m); //print_r($m);
4.根据网页源代码的某个div提取需要的数字:$pat = '/<div class="allnum">.+?<\/div>/'; preg_match_all($pat, $str, $res); preg_match_all('/\d+/', $res[0][0], $nums); //print_r($nums[0][0]);
5.PHP 匹配多对中括号中的内容:$string = "这是[3]def[25]我的[26] "; preg_match_all('/\[([a-z0-9]+)\]/', $string, $matches); //print_r($matches);
6.匹配所有大括号里面的内容: preg_match_all("/{(.*)}/U","sdf{title}dghdg{author} ",$arr); print_r($arr);
7.过滤网页上的所有script标记及其内容:[JS]$pat = "'<script[^>]*?>.*?</script>'si";[HTML]$pat = "'<[\/\!]*?[^<>]*?>'si";[空白字符]$pat = "'([\r\n])[\s]+'"; (替换)$res = preg_replace($pat, "", $str);
8.匹配邮件:$pregEmail = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?/i"; $res = preg_match($pregEmail,$email);
9.匹配手机号:$preg = "/^1(3|5|8)\d{9}$/"; $res = preg_match($preg,$mobile);