04 2019 档案

摘要:将数组打乱随机排列 两种方法: np.random.shuffle(x):在原数组上进行,改变自身序列,无返回值。 np.random.permutation(x):不在原数组上进行,返回新的数组,不改变自身数组。 1. np.random.shuffle(x) (1)、一维数组 import nu 阅读全文
posted @ 2019-04-30 10:32 做梦当财神 阅读(10132) 评论(1) 推荐(1) 编辑
摘要:Pandas包的merge、join、concat方法可以完成数据的合并和拼接,merge方法主要基于两个dataframe的共同列进行合并,join方法主要基于两个dataframe的索引进行合并,concat方法是对series或dataframe进行行拼接或列拼接。 1. Merge方法 pa 阅读全文
posted @ 2019-04-29 17:23 做梦当财神 阅读(76953) 评论(0) 推荐(2) 编辑
摘要:决策树-ID3、C4.5 决策树-CART分类树 决策树-CART回归树 决策树的剪枝通过极小化决策树整体的损失函数。(决策树的生成只考虑局部最优,决策树的剪枝考虑全局最优)。 设 t 是树 T 的叶节点,个数为 |T|,该叶节点有 Nt 个样本点,其中 k 阅读全文
posted @ 2019-04-24 20:44 做梦当财神 阅读(1647) 评论(0) 推荐(0) 编辑
摘要:最大熵模型与逻辑回归类似,是对数线性分类模型。在损失函数优化过程中,使用和支持向量机类似的凸优化技术。对熵的使用,会想起决策树ID3和C4.5。 1. 最大熵模型的定义 将最大熵原理应用到分类得到最大熵模型。 用最大熵模型选择一个最好的分类模型。训练集,其中x为n维特征向量,y为类别输出。 训练集总 阅读全文
posted @ 2019-04-22 20:16 做梦当财神 阅读(784) 评论(0) 推荐(0) 编辑
摘要:欧几里得空间,希尔伯特空间都属于函数空间(函数空间的元素都是由函数组成)。 函数空间的定义得从距离、范数、内积、完备性说起。 1. 距离 距离包括各个点之间的距离,向量之间的距离,曲线之间的距离,函数之间的距离等。 距离用于衡量同一空间不同元素之间的差异,下面是关于距离的属性: 元素之间的距离大于等 阅读全文
posted @ 2019-04-22 15:35 做梦当财神 阅读(3736) 评论(0) 推荐(0) 编辑
摘要:来自:https://blog.csdn.net/u010451580/article/details/51178225 遗传算法是模仿生物进化机制的随机全局搜索和优化方法。借鉴达尔文进化论和孟德尔的遗传学说。 相关术语: 基因型(genotype):性状染色体的内部表现; 表现形(phenotyp 阅读全文
posted @ 2019-04-03 22:06 做梦当财神 阅读(2340) 评论(1) 推荐(0) 编辑
摘要:支持向量机(一)线性可分支持向量机 支持向量机(二)线性支持向量机 支持向量机(三)非线性支持向量机与核函数 支持向量机(四)SMO算法 本文介绍SVM用于二元分类。 SVM学习策略:间隔最大化,可形式化为一个求解凸二次规划问题。(间隔最大化使它有别于感知机。) 支持向量机模型包括:线性可分支持向量 阅读全文
posted @ 2019-04-01 16:02 做梦当财神 阅读(4453) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示