摘要: #去除img标签,1-7位空格,&nbsp; removeImg = re.compile('<img.*?>| {1,7}|&nbsp;') #删除超链接标签 removeAddr = re.compile('<a.*?>|</a>') #把换行的标签换为\n replaceLine = re.c 阅读全文
posted @ 2017-08-25 07:50 layfork 阅读(210) 评论(0) 推荐(0) 编辑