2018 年 5月 31 日随笔档案 - 猴子吃果冻

2018年5月31日

摘要： 1.总括：线性回归即我们在分析某些数据样本之间的归来吧时，预先假定其存在线性关系。在此假设的基础上，利用数据样本拟合出线性方程的权重参数，进而得出此类数据的通用规律。主要解决的问题:预测连续值变量所对应的结果y 举例：列入我们现在要预测: 1).大首都北京的房价受那些因素影响（当然是一个复杂的问阅读全文

posted @ 2018-05-31 22:45 猴子吃果冻阅读(383) 评论(0) 推荐(0) 编辑

scrapy项目2：爬取智联招聘的金融类高端岗位（spider类）

摘要：恢复内容开始今天我们来爬取一下智联招聘上金融行业薪酬在50-100万的职位。第一步：解析解析网页当我们依次点击下边的索引页面是，发现url的规律如下：第1页：http://www.highpin.cn/zhiwei/ci_180000_180100_as_50_100.html 第2页：ht 阅读全文

posted @ 2018-05-31 15:42 猴子吃果冻阅读(593) 评论(0) 推荐(0) 编辑

scrapy项目1：爬取某培训机构老师信息（spider类）

摘要： 1、scrapy爬虫的流程，可简单该括为以下4步： 1).新建项目 >scrapy startproject 项目名称（例如：myspider） >>scrapy.cfg为项目配置文件 >>myspider:项目的Python模块，将会从这里引用代码 >>mySpider/items.py ：项目的阅读全文

posted @ 2018-05-31 10:52 猴子吃果冻阅读(435) 评论(0) 推荐(0) 编辑

Scrapy终端（Scrapy shell）

摘要： 1.介绍文档：http://scrapy-chs.readthedocs.io/zh_CN/latest/topics/shell.html# 2.终端的启用方式：scrapy shell url url 即为你要爬取的网站 3.使用scrapy shell遇到的问题当用scrapy shell访阅读全文

posted @ 2018-05-31 09:31 猴子吃果冻阅读(236) 评论(0) 推荐(0) 编辑

猴子吃果冻

公告