摘要: 爬取sohu所有的链接,找到所有包含足球的网页内容,并进行下载保存。文件序号从1.html......n.htmlrequest访问sohu首页,获取源码使用正则获取网页链接:建议大家获取所有的链接后打印一下内容,在看怎么处理链接。处理网页链接:拼接http:// 过滤掉jpg\css\js\png 阅读全文
posted @ 2019-10-20 20:24 翻滚的小强 阅读(169) 评论(0) 推荐(0) 编辑
摘要: urllib相关的应用(证书、超时、文件上传、url编码) 一、证书相关、禁止警告信息 运行: 二、超时异常 1、设置超时时间较短 运行: 2、设置超时时间较长,捕获异常 运行: 三、上传文件 四、可实现编码(URL编码) 阅读全文
posted @ 2019-10-20 18:37 翻滚的小强 阅读(336) 评论(0) 推荐(0) 编辑