随笔档案「2019年4月」 - 做梦当财神

np.random.shuffle(x)与np.random.permutation(x)

摘要：将数组打乱随机排列两种方法： np.random.shuffle(x)：在原数组上进行，改变自身序列，无返回值。 np.random.permutation(x)：不在原数组上进行，返回新的数组，不改变自身数组。 1. np.random.shuffle(x) (1)、一维数组 import nu 阅读全文

posted @ 2019-04-30 10:32 做梦当财神阅读(10274) 评论(1) 推荐(1)

pandas-数据的合并与拼接

摘要：Pandas包的merge、join、concat方法可以完成数据的合并和拼接，merge方法主要基于两个dataframe的共同列进行合并，join方法主要基于两个dataframe的索引进行合并，concat方法是对series或dataframe进行行拼接或列拼接。 1. Merge方法 pa 阅读全文

posted @ 2019-04-29 17:23 做梦当财神阅读(77220) 评论(0) 推荐(2)

决策树后剪枝

摘要：决策树-ID3、C4.5 决策树-CART分类树决策树-CART回归树决策树的剪枝通过极小化决策树整体的损失函数。(决策树的生成只考虑局部最优，决策树的剪枝考虑全局最优)。设 \(t\) 是树 \(T\) 的叶节点，个数为 \(|T|\)，该叶节点有 \(N_t\) 个样本点，其中 \(k\) 阅读全文

posted @ 2019-04-24 20:44 做梦当财神阅读(1702) 评论(0) 推荐(0)

最大熵模型

摘要：最大熵模型与逻辑回归类似，是对数线性分类模型。在损失函数优化过程中，使用和支持向量机类似的凸优化技术。对熵的使用，会想起决策树ID3和C4.5。 1. 最大熵模型的定义将最大熵原理应用到分类得到最大熵模型。用最大熵模型选择一个最好的分类模型。训练集，其中x为n维特征向量，y为类别输出。训练集总阅读全文

posted @ 2019-04-22 20:16 做梦当财神阅读(858) 评论(0) 推荐(0)

欧几里得空间与希尔伯特空间

摘要：欧几里得空间，希尔伯特空间都属于函数空间（函数空间的元素都是由函数组成）。函数空间的定义得从距离、范数、内积、完备性说起。 1. 距离距离包括各个点之间的距离，向量之间的距离，曲线之间的距离，函数之间的距离等。距离用于衡量同一空间不同元素之间的差异，下面是关于距离的属性：元素之间的距离大于等阅读全文

posted @ 2019-04-22 15:35 做梦当财神阅读(3901) 评论(0) 推荐(0)

遗传算法（GA）

摘要：来自：https://blog.csdn.net/u010451580/article/details/51178225 遗传算法是模仿生物进化机制的随机全局搜索和优化方法。借鉴达尔文进化论和孟德尔的遗传学说。相关术语：基因型(genotype)：性状染色体的内部表现；表现形(phenotyp 阅读全文

posted @ 2019-04-03 22:06 做梦当财神阅读(2427) 评论(1) 推荐(0)

支持向量机（一）线性可分支持向量机

摘要：支持向量机（一）线性可分支持向量机支持向量机（二）线性支持向量机支持向量机（三）非线性支持向量机与核函数支持向量机（四）SMO算法本文介绍SVM用于二元分类。 SVM学习策略：间隔最大化，可形式化为一个求解凸二次规划问题。（间隔最大化使它有别于感知机。）支持向量机模型包括：线性可分支持向量阅读全文

posted @ 2019-04-01 16:02 做梦当财神阅读(4536) 评论(1) 推荐(0)

做梦当财神

04 2019 档案

公告