php simple_html_dom

    这个真的很好用,如果用正则,就太麻烦了。

    首先,下载simple_html_dom,用include_once就可以使用了。

    可以直接定位,可以像个对象一样操作,很方便。

     $ret=file_get_html('url');//获得解析的文档

     find();//函数可以定位标签

     比如: $ret->find('div');//定位div标签

             $ret->find('a',1);//定位a标签的第二个元素,返回的是个数组

             $ret->find(' div a');//定位div 标签里的a元素

             $ret->find('div.content');//定位含有<div class='content'>的块

             $ret->find('div[id=content]');//定位含有<div id='content'>的块

             $ret->find('#id');//定位含有id的标签

    $ret可以遍历元素:

              $ret->parent();

              $ret->children();

              $ret->pre_sibling();

              $ret->next_sibling();

    可以访问标签内容:

             $ret->innertext;

             $ret->outertext;

             $ret->tag;

    可以像对象一样访问元素:

            $ret->href;

 

很强大,用这个解析html很容易和方便,带来特别的简单美。

     

   

posted @   xshang  阅读(3831)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· [AI/GPT/综述] AI Agent的设计模式综述
点击右上角即可分享
微信分享提示