摘要: 一、Windows安装 Twisted下载及安装 二、Ubuntu安装 下载twisted 解压,并cd进去 安装twisted Ubuntu安装注意事项 不要使用 python-scrapyUbuntu提供的软件包,它们通常太旧而且速度慢,无法赶上最新的Scrapy。 要在Ubuntu(或基于Ub 阅读全文
posted @ 2019-03-17 23:59 放弃吧!孩纸 阅读(522) 评论(0) 推荐(0) 编辑
摘要: 环境搭建,django安装,创建项目,django项目简单操作 阅读全文
posted @ 2019-03-17 21:19 放弃吧!孩纸 阅读(457) 评论(0) 推荐(0) 编辑
摘要: 一、简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。 二、安装 三、使用 三、语法 XPath 使用路径表达 阅读全文
posted @ 2019-03-17 19:53 放弃吧!孩纸 阅读(321) 评论(0) 推荐(0) 编辑
摘要: requests库的使用 pip快速安装 请求方法 每一个请求方法都有一个对应的API,比如GET请求就可以使用get()方法: 而POST请求就可以使用post()方法,并且将需要提交的数据传递给data参数即可: 传递URL参数 传递URL参数也不用再像urllib中那样需要去拼接URL,而是简 阅读全文
posted @ 2019-03-17 16:08 放弃吧!孩纸 阅读(2624) 评论(0) 推荐(0) 编辑
摘要: urllib库 urllib 是一个用来处理网络请求的python标准库,它包含4个模块。 urllib.request 请求模块,用于发起网络请求 urllib.parse 解析模块,用于解析URL urllib.error 异常处理模块,用于处理request引起的异常 urllib.robot 阅读全文
posted @ 2019-03-17 14:13 放弃吧!孩纸 阅读(7262) 评论(0) 推荐(0) 编辑
摘要: 目录 01 爬虫的概念 02 爬虫的流程 03 HTTP协议 04 WEBSOCKET 爬虫的概念 爬虫的概念 爬虫更官方点的名字叫数据采集,英文一般称作spider,就是通过编程来全自动的从互联网上采集数据。 比如说搜索引擎就是一种爬虫。 爬虫需要做的就是模拟正常的网络请求,比如你在网站上点击一个 阅读全文
posted @ 2019-03-17 13:02 放弃吧!孩纸 阅读(12873) 评论(0) 推荐(0) 编辑