摘要:
1、数组过滤,只适用于numpyalpha[alpha>0]:返回alpha中大于0的元素组成的数组2、在范围内选取不等于某值的数值j = iwhile j==i: j = int(random.uniform(0,m))3、apply(func, args)这个函数可以间接的调用函数,fun... 阅读全文
摘要:
1、核函数概述:核函数通俗的来说是通过一个函数将向量的低维空间映射到一个高维空间,从而将低维空间的非线性问题转换为高维空间的线性问题来求解,从而再利用之前说的一系列线性支持向量机,常用的核函数如下:多项式核函数: 高斯核函数: 比如硬间隔种的目标函数为: ... 阅读全文
摘要:
根据上个硬间隔最大化已经知道,在解决线性可分数据集的分类问题时,求得拉格朗日乘子、w、b就得到分离超平面,然后就可以进行分类,软间隔最大化是针对非线性可分的数据集,因为并不是数据集在可分的时候会出现一些个别的点不能够被正确划分,而被划分到另一类中,软间隔最大化就是对目标函数加上一个惩罚项,或者说是松... 阅读全文
摘要:
注:以下的默认为2分类1、SVM原理:(1)输入空间到特征空间得映射所谓输入空间即是输入样本集合,有部分情况输入空间与特征空间是相同得,有一部分情况二者是不同的,而模型定义都是定义到特征空间的,特征空间是指所有的输入特征向量,特征向量是利用数值来表示的n维向量,输入空间到特征空间的映射,也就是对所用... 阅读全文
摘要:
1、准备:(1)先验概率:根据以往经验和分析得到的概率,也就是通常的概率,在全概率公式中表现是“由因求果”的果(2)后验概率:指在得到“结果”的信息后重新修正的概率,通常为条件概率(但条件概率不全是后验概率),在贝叶斯公式中表现为“执果求因”的因例如:加工一批零件,甲加工60%,乙加工40%,甲有0... 阅读全文
摘要:
在看机器学习实战时候,到第三章的对决策树画图的时候,有一段递归函数怎么都看不懂,因为以后想选这个方向为自己的职业导向,抱着精看的态度,对这本树进行地毯式扫描,所以就没跳过,一直卡了一天多,才差不多搞懂,才对那个函数中的plotTree.xOff的取值,以及计算cntrPt的方法搞懂,相信也有人和我一... 阅读全文
摘要:
关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要是在决策树里用到的概念,因为在利用特征来分类的时候会对特征选取顺序的选择,这几个概念比较抽象,我也花了好长时间去理解(自己认为的理解),废话不多说,接下来开始对这几个概念解释,防止自己忘记的同时,望对其他人有个借鉴的作用,如... 阅读全文
摘要:
ValueError: invalid literal for int() with base 10: ''不能将非数字字符串转换为整型object has no attribute 对象调用一个没有的方法(内建或自定义)TypeError: only length-1 arrays can be ... 阅读全文