关于php使用xpath解析html中文乱码问题

1 $str2 = '<div id="content">我很好   </div>';     
2  $dom = new DOMDocument();
3  //load之前强转字符编码
4 $str2 = mb_convert_encoding($str2 ,'HTML-ENTITIES',"UTF-8");
5 $dom->loadHTML($str2);
6 $xpath = new DOMXPath($dom);
7 $element = $xpath->query("//div[@id='content']")->item(0)->nodeValue;
8  var_dump($element);

在处理html时,除了可以用正则外,可以考虑使用dom来解析。解决中文乱码就是在load文件之前,转换编码。

posted @   zhou_blog  阅读(817)  评论(0编辑  收藏  举报
编辑推荐:
· 后端思维之高并发处理方案
· 理解Rust引用及其生命周期标识(下)
· 从二进制到误差:逐行拆解C语言浮点运算中的4008175468544之谜
· .NET制作智能桌面机器人:结合BotSharp智能体框架开发语音交互
· 软件产品开发中常见的10个问题及处理方法
阅读排行:
· 后端思维之高并发处理方案
· 千万级大表的优化技巧
· 在 VS Code 中,一键安装 MCP Server!
· 想让你多爱自己一些的开源计时器
· 10年+ .NET Coder 心语 ── 继承的思维:从思维模式到架构设计的深度解析
历史上的今天:
2016-05-10 关于开启url的pathinfo模式
点击右上角即可分享
微信分享提示