摘要: 图片经过处理后图片会变成黑白无色彩的图像,但可以大概观察到图片中主体的轮廓信息,而还原后的图片的主体对象会被保留,图片中其他内容会变模糊,,主体对象得以突出,通过机器学习完成对图片的信息的提取,图片信息可以保存到本地像素查询本或数据库中 导入类库 提取和存储图像数据 训练图像数据 预测 保存像素查询 阅读全文
posted @ 2018-10-15 19:53 BO00097 阅读(2840) 评论(0) 推荐(0) 编辑
摘要: SVM就是试图把棍放在一堆球中的最佳位置,好让在棍的两边有尽可能大的间隙。这个间隙就是球到棍的距离。 支持向量机:找到分类界面,使支持向量间的间隔最大,支持向量到分割界面的距离最小 支持向量是通过到分割界面距离最小的点的向量,且两向量间的距离最大,在二维中其实就是点 取支持向量间的最大间隔是为了若当 阅读全文
posted @ 2018-10-10 21:16 BO00097 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 导入类库 线性回归 KNN 决策树 阅读全文
posted @ 2018-10-09 21:57 BO00097 阅读(1187) 评论(0) 推荐(0) 编辑
摘要: 在考虑一个结果的概率时候,要考虑众多的属性,贝叶斯算法利用所有可能的数据来进行修正预测,如果大量的特征产生的影响较小,放在一起,组合的影响较大,适合于朴素贝叶斯分类 导入类库 代码 阅读全文
posted @ 2018-10-08 22:19 BO00097 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 决策树是一种用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过从数据特性中推导出简单的决策规则来预测目标变量的值 导入类库 简单版 正式版 泰坦尼克生存率决策 (Decision Tree)及其变种是另一类将输入空间分成不同的区域,每个区域有独立参数的算法。 决策树分类算法是一种基于实例的 阅读全文
posted @ 2018-10-07 09:57 BO00097 阅读(758) 评论(2) 推荐(0) 编辑
摘要: 导入类库 小知识 获取波士顿房价数据 多变量图 热点图 回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法。使用案例一般包括房价预测、股票走势或测试成绩等连续变化的案例; 回归任务的特点是标注的数据集具有数值型的目标变量。也就是说,每一个观察样本都有一个数值型的标注真值以监督算法。 线性 阅读全文
posted @ 2018-10-06 09:52 BO00097 阅读(641) 评论(0) 推荐(0) 编辑
摘要: 导入类库 代码 阅读全文
posted @ 2018-10-05 09:43 BO00097 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 基础 机器学习主要有两种,监督学习和非监督学习。监督学习就是督促计算机去学习,明确告诉它目标是什么,非监督学习是让计算机“自学成才”,没有设定目标,学习完告诉我你学到了什么 数据预处理 导入类库 数据处理 字典数据抽取 代码 结果 英文特征值化 代码 结果 中文特征值化 代码 结果 词频 代码 结果 阅读全文
posted @ 2018-10-04 09:51 BO00097 阅读(651) 评论(0) 推荐(1) 编辑
摘要: scrapy 安装scrapy windows可能安装失败,需要先安装c++库或twisted,pip install twisted 创建项目 该命令将会创建包含下列内容的 tutorial 目录: 编写第一个爬虫 为了创建一个Spider,您必须继承 scrapy.Spider 类,定义以下三个 阅读全文
posted @ 2018-09-29 18:51 BO00097 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 结构 生产者生成网址并放入队列 多个消费者从队列中取出网址 类 爬虫类需要继承多线程类 初始化方法需要继承父类初始化方法 创建对象,直接start就会调用类中run方法 协程 协程(coroutine):轻量级的线程,不存在上下文切换,能在多个任务之间调度的多任务方式,可以使用yield实现 请使用 阅读全文
posted @ 2018-09-28 19:43 BO00097 阅读(384) 评论(0) 推荐(0) 编辑