摘要:
爬取sohu所有的链接,找到所有包含足球的网页内容,并进行下载保存。文件序号从1.html......n.htmlrequest访问sohu首页,获取源码使用正则获取网页链接:建议大家获取所有的链接后打印一下内容,在看怎么处理链接。处理网页链接:拼接http:// 过滤掉jpg\css\js\png 阅读全文
摘要:
urllib相关的应用(证书、超时、文件上传、url编码) 一、证书相关、禁止警告信息 运行: 二、超时异常 1、设置超时时间较短 运行: 2、设置超时时间较长,捕获异常 运行: 三、上传文件 四、可实现编码(URL编码) 阅读全文