摘要:
在豆瓣图书爬取书籍信息为例(爬取下面划红线的信息) 1.先创建一个mySpider项目(如何创建项目上面已经说过了) 2.打开mySpider目录下的items.py Item 定义结构化数据字段,用来保存爬取到的数据(因为要爬取的是两行信息,下面定义两个变量来存取字符串) 2.在Terminal终 阅读全文
摘要:
第一章绪论个人认为最多的是概念问题,对机器学习中一些基本概念有初步的了解 下面是一些术语的概念: 1.机器学习研究如何通过计算的手段,利用经验(数据)改善系统自身的性能 2.模型(学习器):泛指从数据中学到的结果 3.样本(示例、特征向量):关于一个事件或对象的描述(可以是一个采样,有时也可以看做整 阅读全文