摘要: 在豆瓣图书爬取书籍信息为例(爬取下面划红线的信息) 1.先创建一个mySpider项目(如何创建项目上面已经说过了) 2.打开mySpider目录下的items.py Item 定义结构化数据字段,用来保存爬取到的数据(因为要爬取的是两行信息,下面定义两个变量来存取字符串) 2.在Terminal终 阅读全文
posted @ 2018-12-03 15:53 Miss-Gao 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 第一章绪论个人认为最多的是概念问题,对机器学习中一些基本概念有初步的了解 下面是一些术语的概念: 1.机器学习研究如何通过计算的手段,利用经验(数据)改善系统自身的性能 2.模型(学习器):泛指从数据中学到的结果 3.样本(示例、特征向量):关于一个事件或对象的描述(可以是一个采样,有时也可以看做整 阅读全文
posted @ 2018-12-03 09:21 Miss-Gao 阅读(134) 评论(0) 推荐(0) 编辑