PHP将富文本内容去除各类样式图片等只保留txt文本内容(作用于SEO的description)
1.从数据库读取富文本内容样式如下:
<p style=";text-indent: 0;padding: 0;line-height: 26px"><span style="font-family: 微软雅黑;letter-spacing: 0;font-size: 14px">&nbsp; &nbsp;这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!</span></p><p style=";text-indent: 0;padding: 0;line-height: 26px"><span style="font-family: 微软雅黑;letter-spacing: 0;font-size: 14px">&nbsp; &nbsp;这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!</span></p><p style="text-indent: 0px; padding: 0px; line-height: 26px; text-align: center;"><span style="font-family: 微软雅黑;letter-spacing: 0;font-size: 14px"><
2.首先通过php的htmlspecialchars_decode()函数把预定义的 HTML 实体 "<"(小于)和 ">"(大于)转换为字符,然后再通过strip_tags()函数剥去字符串中的 HTML、XML 以及 PHP 的标签,即可得到想要的txt纯文本内容。
具体实现php核心代码如下:
$content_01 = $data["content"];//从数据库获取富文本content $content_02 = htmlspecialchars_decode($content_01)//把一些预定义的 HTML 实体转换为字符 $content_03 = str_replace(" ","",$content_02);//将空格替换成空 $contents = strip_tags($content_03);//函数剥去字符串中的 HTML、XML 以及 PHP 的标签,获取纯文本内容 $con = mb_substr($contents, 0, 100,"utf-8");//返回字符串中的前100字符串长度的字符 var_dump($con);//打印输出 exit;