PHP将富文本内容去除各类样式图片等只保留txt文本内容(作用于SEO的description)

1.从数据库读取富文本内容样式如下:

<p style=";text-indent: 0;padding: 0;line-height: 26px"><span style="font-family: 微软雅黑;letter-spacing: 0;font-size: 14px">   这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!</span></p><p style=";text-indent: 0;padding: 0;line-height: 26px"><span style="font-family: 微软雅黑;letter-spacing: 0;font-size: 14px">   这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!这是一个小小的测试!</span></p><p style="text-indent: 0px; padding: 0px; line-height: 26px; text-align: center;"><span style="font-family: 微软雅黑;letter-spacing: 0;font-size: 14px"><

2.首先通过php的htmlspecialchars_decode()函数把预定义的 HTML 实体 "<"(小于)和 ">"(大于)转换为字符,然后再通过strip_tags()函数剥去字符串中的 HTML、XML 以及 PHP 的标签,即可得到想要的txt纯文本内容。

 

具体实现php核心代码如下:

 

$content_01 = $data["content"];//从数据库获取富文本content
$content_02 = htmlspecialchars_decode($content_01)//把一些预定义的 HTML 实体转换为字符
$content_03 = str_replace(" ","",$content_02);//将空格替换成空
$contents = strip_tags($content_03);//函数剥去字符串中的 HTML、XML 以及 PHP 的标签,获取纯文本内容
$con = mb_substr($contents, 0, 100,"utf-8");//返回字符串中的前100字符串长度的字符

var_dump($con);//打印输出
exit;

 

posted @ 2016-09-13 14:49  申文哲  阅读(9144)  评论(0编辑  收藏  举报