摘要:
一 机器学习分类 有监督学习 1 概述: 主要用于决策支持,它利用有 标识 的历史数据进行训练,以实现对新数据的表示的预测 2 分类: 分类计数预测的数据对象是 离散 的。如短信是否为垃圾短信,用户是否喜欢电子产品 比如: K近邻、朴素贝叶斯、决策树、SVM 3 回归: 回归技术预测的数据对象是 阅读全文
摘要:
1 朴素贝叶斯概述 朴素贝叶斯是一种简单但是非常强大的线性分类器。它在垃圾邮件分类,疾病诊断中都取得了很大的成功。它只所以称为朴素,是因为它假设特征之间是相互独立的,但是在现实生活中,这种假设基本上是不成立的。那么即使是在假设不成立的条件下,它依然表现的很好,尤其是在小规模样本的情况下。但是,如 阅读全文
摘要:
1 决策树概述 决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直 阅读全文
摘要:
一 评价尺度 sklearn包含四种评价尺度 1 均方差(mean squared error) 2 平均绝对值误差(mean_absolute_error) 3 可释方差得分(explained_variance_score) 4 中值绝对误差(Median absolute error) 5 R 阅读全文
摘要:
一 线性回归(Linear Regression ) 1. 线性回归概述 回归的目的是预测数值型数据的目标值,最直接的方法就是根据输入写出一个求出目标值的计算公式,也就是所谓的回归方程,例如y = ax1+bx2,其中求回归系数的过程就是回归。那么回归是如何预测的呢?当有了这些回归系数,给定输入,具 阅读全文
摘要:
1 机器学习处理流程: 2 机器学习分类: 有监督学习 主要用于决策支持,它利用有标识的历史数据进行训练,以实现对新数据的表示的预测 1 分类 分类计数预测的数据对象是离散的。如短信是否为垃圾短信,用户是否喜欢电子产品 常用方法: K近邻、朴素贝叶斯、决策树、SVM 2 回归 回归技术预测的数据对象 阅读全文
摘要:
plot语句中支持除X,Y以外的参数,以字符串形式存在,来控制颜色、线型、点型等要素,语法形式为: plt.plot(X, Y, 'format', ...) 1 点和线的样式 颜色 透明度 背景色 设置背景色,通过plt.subplot()方法传入facecolor参数,来设置坐标轴的背景色 线型 阅读全文
摘要:
1 Scipy简介 Scipy依赖于Numpy Scipy提供了真正的矩阵 Scipy包含的功能:最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理、图像处理、常微分方程求解器等 Scipy是高端科学计算工具包 Scipy由一些特定功能的子模块组成 2 图片消噪:傅里叶变换 3 阅读全文
摘要:
常见聚合方法 | 方法 | 说明 | | | | | count | 计数 | | describe | 给出各列的常用统计量 | | min,max | 最大最小值 | | argmin,argmax | 最大最小值的索引位置(整数) | | idxmin,idxmax | 最大最小值的索引值 | 阅读全文
摘要:
注意:模拟登陆时,必须保证settings.py里的COOKIES_ENABLED(Cookies中间件) 处于开启状态 或` COOKIES_ENABLED = False` 策略一:直接POST数据(比如需要登陆的账户信息) 只要是需要提供post数据的,就可以用这种方法。下面示例里post的数 阅读全文