捧腹网短笑话正则匹配-如何剔除网页源码的制表符
摘要:以捧腹网的短笑话为例,我们可以通过requests方法提取出网页的源代码,然后通过正则匹配来得到相关的短笑话 第一步,得到网页源码,使用requests的get方法,需要注意的是,网页默认编码是utf-8,我们需要指定编码格式为utf-8,才能正确显示出网页的文本信息 #-*- coding:utf
阅读全文
posted @ 2018-05-16 11:18
posted @ 2018-05-16 11:18
posted @ 2018-05-15 17:31
Powered by:
博客园
Copyright © 2025 Aaron2932
Powered by .NET 9.0 on Kubernetes