摘要: (. ?)实验室 ['www', '', '', 'www', '', '', 'www', '', ''] ['', '', '', '', '', '', '', '', '', '', '', '', '', '', ''] ['www', 'www', 'www'] ['w', 'w', ' 阅读全文
posted @ 2019-08-24 20:19 zx125 阅读(209) 评论(0) 推荐(1) 编辑
摘要: 循环导入 a.py b.py 以a.py为执行文件 出现了以上错误,大概意思就是在 中没有找到 这个属性 执行流程 是啥? 是一个全局字典,该字典是python启动后就加载在内存中。每当程序员导入新的模块,sys.modules都将记录这些模块。字典sys.modules对于加载模块起到了缓冲的作用 阅读全文
posted @ 2019-08-24 19:27 zx125 阅读(223) 评论(0) 推荐(0) 编辑
摘要: bs4 安装 bs4有两种运行方式一种是处理本地资源,一种是处理网络资源 本地 网络 实例化对象的方法 soup.tagname 直接返回第一个 标签的内容 soup.find() soup.find_all() soup.select() 获取标签的文本内容 获取标签中的属性值 基本使用 案例爬取 阅读全文
posted @ 2019-08-24 18:34 zx125 阅读(737) 评论(1) 推荐(1) 编辑
摘要: 糗图 图片爬取 主要思路 1.来到首页,查看主页有用图片存在html的规律 2.编写re提取图片路径 3.右键图片查看请求图片的具体路径 4.拼接图片请求路径 5.查看下一页界面的路径,找到界面请求路径规律 6.work,多界面爬取指定图片爬虫 import requests import re i 阅读全文
posted @ 2019-08-24 14:25 zx125 阅读(864) 评论(0) 推荐(1) 编辑
摘要: re实战记录 针对网页中的空格符 一般使用的 ,但是它不能匹配 ,所以使用 或者 匹配所有字符 import re l1=r''' ''' print(re.findall('[\d\D] ? 阅读全文
posted @ 2019-08-24 13:57 zx125 阅读(179) 评论(0) 推荐(0) 编辑