功能: 成对匹配html标签对, 跟javascript的$.getElementById() 方法 一样.多层嵌套也很ok

不使用递归方法,而是利用栈的知识,通过位置回退方法、顺序进行匹配关闭标签。

 

eg:

<?php
$str = '
    <div id="left" class="*xxx" style="float: left;width:520px; height: 200px; " >
        <div class="new_model1">
            <p> <a href="#" >title</a> </p>
        </div>
        <div class="new_model2">
            <p> <a href="#" >title</a> </p>
        </div>
        <div>
            dsss
            <div>dsss</div>    
            <div>dsss</div>    
            <div>dsss</div>    
        </div>    
        <!-- 多层嵌套 -->
        <div class="000"><div class="000"><div class="000"><div class="000"><div class="000"></div></div></div></div><div class="000"></div></div>

    </div>
    <div class="111"><div class="111"><div class="111"><div class="111"><div class="111"></div></div></div></div><div class="111"></div><div class="111"><div class="111"><div class="111"></div></div></div><div class="111"></div></div>

';
var_dump( getElementById( $str , 'left' ) );

输出结果:
    <div id="left" class="*xxx" style="float: left;width:520px; height: 200px; " >
           ...
        <!-- 多层嵌套 -->
        <div class="000"><div class="000"><div class="000"><div class="000"><div class="000"></div></div></div></div><div class="000"></div></div>
    </div>

 

多层嵌套的结果符合预期。欢迎测试如有bug留言。

 

代码:

/*
* 功能: 成对匹配html标签对, 跟javascript的$.getElementById() 方法 一样.
* 实现方法: 成对匹配html标签对(多层嵌套也能完整匹配)
            ( 没有用到递归, 而是通过位置回退方法、顺序进行匹配 )
* 参数:
    @string: $content: 输入内容;
    @string: $id 标签的id;
    @string: $return_type   设定返回值的类型,
                可选返回 'endpos'(结束位置) 或者 'substr'(截取结果).
* 返回:  数字 或 字符串 , 取决于 $return_type的设置.
* @author: 王奇疏 

*/ function getElementById( $content , $id , $return_type='substr' ) { // 匹配唯一标记的标签对 if ( preg_match( '@<([a-z]+)[^>]*id=[\"\']?'.$id.'[\"\']?[^>]*>@i' , $content , $res ) ){ $start = $next_pos = strpos( $content , $res[0] ); ++$next_pos; $start_tag = '<'.$res[1]; // 开始标签 $end_tag = '</'.$res[1].'>'; // 结束标签 $i = 1;
$j = 0; // 防死循环    
// 只要计数大于0, 就继续查,查到计数器为0为止, 就是最终的关闭标签. while ( $i > 0 && $j < 1024 ){ $p_start = stripos( $content , $start_tag , $next_pos ); $p_end = stripos( $content , $end_tag , $next_pos );      if ( false === $p_start && false !== $p_end ){

      $next_pos = $p_end + 1;

      break;

     }
// 如果 elseif ( $p_start > $p_end ){ $next_pos = $p_end + 1; --$i; } else{ $next_pos = $p_start + 1; ++$i; } }
        if ( $j == 1024 ){
            exit( '调用getElementById时出现错误::<font color="red">您的标签'.htmlspecialchars( "{$start_tag} id='{$id}'>" ).' 在使用时根本没有闭合,不符合xhtml,系统强制停止匹配</font>.' );
        }
// 返回结果 if ( 'substr' == $return_type ){ return substr( $content , $start , $next_pos-$start + strlen( $end_tag ) ); } elseif ( 'endpos' == $return_type ){ return $next_pos + strlen( $end_tag ) - 1 ; } else{ return false; } } else{ return false; } }

 

 

posted on 2012-10-27 19:22  王奇疏  阅读(2270)  评论(3编辑  收藏  举报