摘要: 1.总括:线性回归即我们在分析某些数据样本之间的归来吧时,预先假定其存在线性关系。 在此假设的基础上,利用数据样本拟合出线性方程的权重参数,进而得出此类数据的通用规律。 主要解决的问题:预测连续值变量所对应的结果y 举例:列入我们现在要预测: 1).大首都北京的房价受那些因素影响(当然是一个复杂的问 阅读全文
posted @ 2018-05-31 22:45 猴子吃果冻 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 今天我们来爬取一下智联招聘上金融行业薪酬在50-100万的职位。 第一步:解析解析网页 当我们依次点击下边的索引页面是,发现url的规律如下: 第1页:http://www.highpin.cn/zhiwei/ci_180000_180100_as_50_100.html 第2页:ht 阅读全文
posted @ 2018-05-31 15:42 猴子吃果冻 阅读(593) 评论(0) 推荐(0) 编辑
摘要: 1、scrapy爬虫的流程,可简单该括为以下4步: 1).新建项目 >scrapy startproject 项目名称(例如:myspider) >>scrapy.cfg为项目配置文件 >>myspider:项目的Python模块,将会从这里引用代码 >>mySpider/items.py :项目的 阅读全文
posted @ 2018-05-31 10:52 猴子吃果冻 阅读(435) 评论(0) 推荐(0) 编辑
摘要: 1.介绍文档:http://scrapy-chs.readthedocs.io/zh_CN/latest/topics/shell.html# 2.终端的启用方式:scrapy shell url url 即为你要爬取的网站 3.使用scrapy shell遇到的问题 当用scrapy shell访 阅读全文
posted @ 2018-05-31 09:31 猴子吃果冻 阅读(236) 评论(0) 推荐(0) 编辑