php - preg_match

任务:匹配一个函数名或者变量名,如果碰到alpha,numeric,_以外的全部不允许通过。

实验1:

<?php
//第一个字符不符合就直接退出正则匹配
$str = '%abcscript%d';
var_dump(preg_match('/^(\w*)$/', $str, $matches));
var_dump($matches);
#########output########
#int(0)
#array(0) {
#}
#######################

#匹配到
$str1 = 'abcscriptd123_';
var_dump(preg_match('/^(\w*?)$/', $str1, $matches));
var_dump($matches);
#########output########
#int(1)
#array(2) {
#    [0]=>
#    string(14) "abcscriptd123_"
#    [1]=>
#    string(14) "abcscriptd123_"
#}
#######################

#中间有不匹配模式的
$str2 = 'acd%acd';
var_dump(preg_match('/^(\w*?)/', $str2, $matches));
var_dump($matches);
#########output########
#int(1)
#array(2) {
#    [0]=>
#        string(0) ""
#    [1]=>
#        string(0) ""
#}
#####################
//检查一个字符串里面仅包含字母数字或者下划线

 第一个的结果显而易见,preg_match返回0,第二个的结果如预期是全串都符合并匹配到,第三个的结果有些出人意料,那为什么preg_match返回1,而$matches未如预期一样包含匹配到的acd呢?

再做一个实验,实验2

<?php
#中间有不匹配模式的
$str2 = 'acd%acd';
var_dump(preg_match('/^(\w*)/', $str2, $matches));
var_dump($matches);
#########output########
#int(1)
#array(2) {
#  [0]=>
#  string(3) "acd"
#  [1]=>
#  string(3) "acd"
#}
#####################

实验2的结果:这次可以匹配到符合条件的部分子串 "acd" 了。

对比结果表明:?这个贪婪匹配符起到了很重要的作用,但是对其的工作原理仍然不甚明了。需要继续深入理解。 

那么如何完成任务?要检查一个字符串是否只包含alpha, numeric, _

结论是: preg_match('/(\w*)/', $str, $matches);

检查$matches[1] == $str,如果为true则表示该字符串满足条件,为false则表示该字符串不满足条件

<?php
$str = 'acd123_';
var_dump(check_word($str));
$str = 'acd%123_';
var_dump(check_word($str));
$str = '%acd123_';
var_dump(check_word($str));

function check_word($str)
{
    preg_match('/^(\w*)/', $str, $matches);
    if($matches[1] == $str){
        return true;
    } else {
        return false;
    }   
}

输出:

bool(true)
bool(false)
bool(false)

任务:把ubb中img标签的内容找出来[img]100.png[/img]

目标:熟悉正则表达式中()的用法

代码:

<?php

$str = '[img]100[/img]test.png[img]1000[/img]';
preg_match_all('/\[img\](.*?)\[\/img\]/', $str, $matches);
var_dump($matches);

  

输出:

array(2) {
  [0]=>
  array(2) {
    [0]=>
    string(14) "[img]100[/img]"
    [1]=>
    string(15) "[img]1000[/img]"
  }
  [1]=>
  array(2) {
    [0]=>
    string(3) "100"
    [1]=>
    string(4) "1000"
  }
}

任务:把[img]100[/img]提取出来,满足两个要求:能够提取100,并且能够提取出[img]100[/img]这样的模式

目标:熟悉正则表达式中()的用法

代码:

<?php

$str = '[img]100[/img]test.png[img]1000[/img]';
preg_match_all('/(\[img\](.*?)\[\/img\])/', $str, $matches);
var_dump($matches);

 

输出: 

array(3) {
  [0]=>
  array(2) {
    [0]=>
    string(14) "[img]100[/img]"
    [1]=>
    string(15) "[img]1000[/img]"
  }
  [1]=>
  array(2) {
    [0]=>
    string(14) "[img]100[/img]"
    [1]=>
    string(15) "[img]1000[/img]"
  }
  [2]=>
  array(2) {
    [0]=>
    string(3) "100"
    [1]=>
    string(4) "1000"
  }
}

理解:正则表达式的括号()能提取字符串中的那些匹配的串,0号match是整个模式的匹配串,1号match是从左往右的第一个()括号中匹配的内容,2号match是第二个()括号中匹配的内容,以此类推。

 

关于preg_match_all, 可见另一篇文章:http://www.cnblogs.com/helww/p/3248345.html

 

keyword: preg_match preg_match_all

posted on 2013-12-10 00:31  awildfish  阅读(475)  评论(0编辑  收藏  举报

导航