摘要: 1.问题引入 总括:逻辑回归其实就是将分类问题数学化,也就是将类别的现象用具体的函数去刻画。 现象:如下图,就是一个二分类的具体现象,我们总可以找到一条曲线(判定边界)将两种现象或者特征分割开来. 2.问题求解 问题1:如何用函数去刻画上述分类问题中的判定边界? 我们可以将上述判定边界分成两个类别, 阅读全文
posted @ 2018-06-05 14:18 猴子吃果冻 阅读(3664) 评论(0) 推荐(1) 编辑
摘要: 下载中间键的设置可以分为两步:以设置代理和user-agent为例 第一步:编写中间件文件,代码如下: 上述图片中的USER_AGENT_LIST可以卸载中间键(middlewares.py)中,也可以写在settings.py中,如下图: 第二步:在settings.py文件中启用中间键 阅读全文
posted @ 2018-06-03 19:02 猴子吃果冻 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 1.启动爬虫的命令为: scrapy crawl spidername(爬虫名) 2.我们还可以通过下述方式来启动爬虫 步骤一:创建一个.py文件。startspider.py(这里文件的名称可以自己给定) 步骤二:通过python startspider.py来运行此文件即可 阅读全文
posted @ 2018-06-03 17:33 猴子吃果冻 阅读(5696) 评论(0) 推荐(1) 编辑
摘要: scrapy项目3中已经对网页规律作出解析,这里用crawlspider类对其内容进行爬取; 项目结构与项目3中相同如下图,唯一不同的为book.py文件 crawlspider类的爬虫文件book的生成命令为:scrapy genspider -t crawl book 'category.dan 阅读全文
posted @ 2018-06-03 15:46 猴子吃果冻 阅读(348) 评论(0) 推荐(0) 编辑
摘要: 1.网页解析 当当网中,人工智能数据的首页url如下为http://category.dangdang.com/cp01.54.12.00.00.00.html 点击下方的链接,一次观察各个页面的url变化,发现每一页的url规律如下:在进行页面切换时除第一页外,其他页面的url变化规律为只有pg后 阅读全文
posted @ 2018-06-03 15:27 猴子吃果冻 阅读(320) 评论(0) 推荐(0) 编辑
摘要: 1.Scrapy图例: Scrapy Engine(引擎): 负责Spider、ItemPipeline、Downloader、Scheduler中间的通讯,信号、数据传递等。 Scheduler(调度器): 它负责接受引擎发送过来的Request请求,并按照一定的方式进行整理排列,入队,当引擎需要 阅读全文
posted @ 2018-06-01 17:22 猴子吃果冻 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 1.总括:线性回归即我们在分析某些数据样本之间的归来吧时,预先假定其存在线性关系。 在此假设的基础上,利用数据样本拟合出线性方程的权重参数,进而得出此类数据的通用规律。 主要解决的问题:预测连续值变量所对应的结果y 举例:列入我们现在要预测: 1).大首都北京的房价受那些因素影响(当然是一个复杂的问 阅读全文
posted @ 2018-05-31 22:45 猴子吃果冻 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 今天我们来爬取一下智联招聘上金融行业薪酬在50-100万的职位。 第一步:解析解析网页 当我们依次点击下边的索引页面是,发现url的规律如下: 第1页:http://www.highpin.cn/zhiwei/ci_180000_180100_as_50_100.html 第2页:ht 阅读全文
posted @ 2018-05-31 15:42 猴子吃果冻 阅读(592) 评论(0) 推荐(0) 编辑
摘要: 1、scrapy爬虫的流程,可简单该括为以下4步: 1).新建项目 >scrapy startproject 项目名称(例如:myspider) >>scrapy.cfg为项目配置文件 >>myspider:项目的Python模块,将会从这里引用代码 >>mySpider/items.py :项目的 阅读全文
posted @ 2018-05-31 10:52 猴子吃果冻 阅读(435) 评论(0) 推荐(0) 编辑
摘要: 1.介绍文档:http://scrapy-chs.readthedocs.io/zh_CN/latest/topics/shell.html# 2.终端的启用方式:scrapy shell url url 即为你要爬取的网站 3.使用scrapy shell遇到的问题 当用scrapy shell访 阅读全文
posted @ 2018-05-31 09:31 猴子吃果冻 阅读(236) 评论(0) 推荐(0) 编辑