捧腹网短笑话正则匹配-如何剔除网页源码的制表符
摘要:
以捧腹网的短笑话为例,我们可以通过requests方法提取出网页的源代码,然后通过正则匹配来得到相关的短笑话 第一步,得到网页源码,使用requests的get方法,需要注意的是,网页默认编码是utf-8,我们需要指定编码格式为utf-8,才能正确显示出网页的文本信息 #-*- coding:utf 阅读全文
posted @ 2018-05-16 11:18 Aaron2932 阅读(349) 评论(0) 推荐(0) 编辑