摘要: 拉格朗日对偶问题的转换可以参考:https://www.cnblogs.com/90zeng/p/Lagrange_duality.html 拉格朗日函数泛化的KKT条件而得出的求解函数极大极小问题,可参考:https://www.cnblogs.com/zhangchaoyang/articles 阅读全文
posted @ 2017-12-11 19:55 小丑_jk 阅读(386) 评论(0) 推荐(0) 编辑
摘要: 支持向量机的学习策略就是间隔最大化,形式转化为求解凸二次规划问题。该算法就是求解凸二次规划的最优化算法。 当训练数据线性可分时候,通过硬间隔最大化,学习线性分类器,称为硬间隔支持向量机;当训练数据近似线性可分时,通过软间隔最大化,学习线性分类器,称为软间隔最大化;当数据线性不可分时,通过使用核技巧及 阅读全文
posted @ 2017-12-07 15:35 小丑_jk 阅读(336) 评论(0) 推荐(0) 编辑
摘要: 二项logistic回归模型符合如下概率分布: 其中wx表示w和x的内积 上式同样也可以表示为: 其中p=P(Y=1|x) 二分类数据集(x1,y1),(x2,y2),....(xn,yn) 将设p=P(Y=1|x)=π(x),则1-p=P(Y=0|x)=1-π(x) 那么观测值的概率发生概率同样能 阅读全文
posted @ 2017-12-06 23:57 小丑_jk 阅读(422) 评论(0) 推荐(0) 编辑
摘要: CART树: 该树的生成就是递归的构建二叉决策树的过程,对回归树用平方误差最小化准则,对分类树用gini指数最小化准则,进行特征选择,生成二叉树。 (1)回归树 假设X和Y分别为输入和输出变量,Y为连续变量,给定数据集D={(x1,y1),(x2,y2),...(xn,yn)} 假设输入空间划分为M 阅读全文
posted @ 2017-12-04 18:18 小丑_jk 阅读(749) 评论(0) 推荐(0) 编辑
摘要: ID3算法: ID3算法就是在决策树上各个结点应用信息增益准则作为特征筛选,然后递归的构建决策树。具体算法如下所示: 输入:训练数据集D,特征集A,阈值e 输出:决策树T (1)若D中所有实例属于同一类Ck,则T为单结点树,并将Ck作为该结点的类标记,返回T (2)若A为空,则T为单结点树,并将D中 阅读全文
posted @ 2017-12-02 19:09 小丑_jk 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 决策树本质就是从训练数据集中归纳出一组分类规则,通过训练与数据集矛盾较小的决策树,同时具有较好的泛化能力。 通常该算法是一个递归的选择最优特征,并根据该特征对训练数据集进行分割,使得对各个子数据集具有较好的分类的过程。最开始将所有特征都放置在根结点, 选择最优特征,按照特征将训练集进行划分,使各子集 阅读全文
posted @ 2017-12-01 22:56 小丑_jk 阅读(571) 评论(0) 推荐(0) 编辑
摘要: (1)朴素贝叶斯基本方法: 输入数据有:标记集合 y={c1,c2,...ck}, 特征向量x , 也即训练数据集T={(x1,y1),(x2,y2),....(xn,yn)} 朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y)(通过联合概率分布P(X,Y)进行不同条件概率的转换), 先验概率分 阅读全文
posted @ 2017-11-30 00:03 小丑_jk 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 这个算法较为简单,主要思想就是给定分好类的数据集,然后将新输入的数据集进入训练集中找到与之最相近的k类,然后将k类所属类别最多的一类作为新数据的分类结果。 注:k的取值对模型拟合效果和预测效果影响较大 其中距离函数有如下表示形式: 当上式的p为2时,也就是欧式距离;当上式p为1时,也就是曼哈顿距离。 阅读全文
posted @ 2017-11-29 15:33 小丑_jk 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 知识预备: 数据线性可分: 对于给定数据集T={(x1,y1),(x2,y2),...,(xn,yn)},;若存在平面wx+b=0将正实例点和负实例点正确划分到两侧,也就是对所有yi=+1的实例,都有wxi+b>0, 对于所有yi=-1的实例,都有都有wxi+b<0;那么就称数据集T为线性可分数据。 阅读全文
posted @ 2017-11-25 18:13 小丑_jk 阅读(734) 评论(0) 推荐(0) 编辑
摘要: numpy包: pandas包: math包: collection包: 其他: def aa(ali): for i in ali: i=i+1 yield i+5 b=aa([1,2,3,4]) [w for w in b] #返回[7,8,9,10] sys包: os包: assert用法: 阅读全文
posted @ 2017-11-24 12:13 小丑_jk 阅读(765) 评论(0) 推荐(0) 编辑