摘要: pyquery 初始化 字符串初始化 URL初始化 文件初始化 基本CSS选择器 id class. tag none 查找元素 子元素 父元素 兄弟元素 遍历 单个元素 获取信息 获取属性 获取文本 a.text() 获取HTML li.html() DOM操作 addClass, removeC 阅读全文
posted @ 2019-07-12 20:58 鬼鬼果果 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 基本使用 标签选择器 就是相当于soup的属性,soup.Tag 有多个,只返回第一个 获取名称 在标签后加 .name 获取属性 子节点 soup.Tag.contents 子节点以列表形式返回 soup.Tag.children 迭代器,需要循环才能输出 子孙节点 soup.Tag.descen 阅读全文
posted @ 2019-07-12 18:47 鬼鬼果果 阅读(123) 评论(0) 推荐(0) 编辑
摘要: requests 实例引入 请求方式 请求 基本get请求 带参数get请求 解析json 获取二进制数据 添加headers POST请求 response属性 高级操作 文件上传 获取cookie 会话维持 上述方法无法得到想要的cookie 证书验证 暂时不看。如果发生情况则添加参数 veri 阅读全文
posted @ 2019-07-12 16:55 鬼鬼果果 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 使用最普通的urllib来进行爬取 get请求网页 或者利用Request请求网页 响应的内容 post请求网页 改变Header handler 代理 Cookie 异常处理 阅读全文
posted @ 2019-07-12 16:07 鬼鬼果果 阅读(231) 评论(0) 推荐(0) 编辑