js删除html标记 去掉所有html标记 百度文库内容copy
js删除html标记 去掉所有html标记
function delHtml(str){ return str.replace(/<[^>]+>/g,""); //正则去掉所有的html标记 }
//调用测试 delHtml("<div>aaa</div>") 返回结果:aaa
加上去script与style里的内容
function delHtml(str){ str = str.replace("<script[^>]*>[\\d\\D]*?</script>","");//去script str = str.replace("<style[^>]*>[\\d\\D]*?</style>",""); //去style return str.replace(/<[^>]+>/g,""); //正则去掉所有的html标记 }
document.getElementById("dd").innerHTML.replace(/<\/?.+?>/g, "")
得到百度文库某一页所有文字,先要滚动条移动到该页:
然后按F12,在Console下用以下代码:
document.getElementById("pageNo-8").innerHTML.replace(/<\/?.+?>/g, "")
//上面代码将得到第8页内容
欢迎加入JAVA技术交流QQ群:179945282
欢迎加入ASP.NET(C#)交流QQ群:17534377