解决html中出现的​

爬取页面分析入库的时候,数据库中总会多出一个?,研究了好长时间,不是空也不是空格,原来它叫 零宽空白,是一种特殊字符。

在js中可以这么替换:($(".ms-rtestate-field").text()).replace(/\u200B/g,'')

在java中是     str.replace("\u200B","")。

 

posted @ 2019-01-21 15:46  叶落撒  阅读(775)  评论(0编辑  收藏  举报