04 2019 档案
摘要:将数组打乱随机排列 两种方法: np.random.shuffle(x):在原数组上进行,改变自身序列,无返回值。 np.random.permutation(x):不在原数组上进行,返回新的数组,不改变自身数组。 1. np.random.shuffle(x) (1)、一维数组 import nu
阅读全文
摘要:Pandas包的merge、join、concat方法可以完成数据的合并和拼接,merge方法主要基于两个dataframe的共同列进行合并,join方法主要基于两个dataframe的索引进行合并,concat方法是对series或dataframe进行行拼接或列拼接。 1. Merge方法 pa
阅读全文
摘要:决策树-ID3、C4.5 决策树-CART分类树 决策树-CART回归树 决策树的剪枝通过极小化决策树整体的损失函数。(决策树的生成只考虑局部最优,决策树的剪枝考虑全局最优)。 设 是树 的叶节点,个数为 ,该叶节点有 个样本点,其中
阅读全文
摘要:最大熵模型与逻辑回归类似,是对数线性分类模型。在损失函数优化过程中,使用和支持向量机类似的凸优化技术。对熵的使用,会想起决策树ID3和C4.5。 1. 最大熵模型的定义 将最大熵原理应用到分类得到最大熵模型。 用最大熵模型选择一个最好的分类模型。训练集,其中x为n维特征向量,y为类别输出。 训练集总
阅读全文
摘要:欧几里得空间,希尔伯特空间都属于函数空间(函数空间的元素都是由函数组成)。 函数空间的定义得从距离、范数、内积、完备性说起。 1. 距离 距离包括各个点之间的距离,向量之间的距离,曲线之间的距离,函数之间的距离等。 距离用于衡量同一空间不同元素之间的差异,下面是关于距离的属性: 元素之间的距离大于等
阅读全文
摘要:来自:https://blog.csdn.net/u010451580/article/details/51178225 遗传算法是模仿生物进化机制的随机全局搜索和优化方法。借鉴达尔文进化论和孟德尔的遗传学说。 相关术语: 基因型(genotype):性状染色体的内部表现; 表现形(phenotyp
阅读全文
摘要:支持向量机(一)线性可分支持向量机 支持向量机(二)线性支持向量机 支持向量机(三)非线性支持向量机与核函数 支持向量机(四)SMO算法 本文介绍SVM用于二元分类。 SVM学习策略:间隔最大化,可形式化为一个求解凸二次规划问题。(间隔最大化使它有别于感知机。) 支持向量机模型包括:线性可分支持向量
阅读全文