04 2015 档案

机器学习中的相似性度量（转载）

摘要：在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement)，这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究，甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本文目录：1. 欧氏距离2. 曼... 阅读全文

posted @ 2015-04-20 15:22 kongmeng 阅读(188) 评论(0) 推荐(0) 编辑

data and dream

摘要：1 用通俗的语言介绍下线性回归->逻辑回归->SVM之间的区别和联系。2 聚类算法的应用场景，以及k-means中的k值怎么确定。 1 def center(data): 2 3 center = [] 4 for num in data: 5 sumX =... 阅读全文

posted @ 2015-04-17 21:00 kongmeng 阅读(174) 评论(0) 推荐(0) 编辑

脑筋急转弯

摘要：1一个袋子里装有1000枚硬币，其中有一枚是两面都是正面。现从中取出一枚，连续抛掷10次都是正面。问：取出的硬币是两面都是正面的概率有多大？2某个小城镇有10万对夫妇，假设每对夫妇可以随意生孩子直到生出一个男孩为止，并且一对夫妇一年只能生一次。问1）10年后的男女比例；2）n年后，平均每个家庭有多少... 阅读全文

posted @ 2015-04-17 20:39 kongmeng 阅读(324) 评论(0) 推荐(0) 编辑

SQl语句学习笔记（二）

摘要：merge into when matched then... when not mached then... MySQl for Tmall *取得重复的最大值，控制内循环的数量，推荐*/ SQL去除重复 Oracle中替代变量(动态参数)的使用 1. &变量名/&&变量名 &变量名, 执行sql 阅读全文

posted @ 2015-04-03 21:47 kongmeng 阅读(399) 评论(0) 推荐(0) 编辑

Adaboost 算法

摘要：Adaboost 算法 AdaBoost 是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器，即弱分类器，然后把这些弱分类器集合起来，构造一个更强的最终分类器。(很多博客里说的三个臭皮匠赛过诸葛亮) 算法本身是改变数据分布实现的，它根据每次训练集之中的每个样本的分类是否正确，以及上次的总体... 阅读全文

posted @ 2015-04-02 16:51 kongmeng 阅读(525) 评论(0) 推荐(0) 编辑

公告

昵称： kongmeng
园龄： 11年10个月
粉丝： 27
关注： 4

2025年3月

日

一

二

三

四

五

六

kongmeng

04 2015 档案

公告

搜索

常用链接

随笔分类

随笔档案

相册

C语言内存管理

R语言博客关注

推荐系统/数据挖掘

阅读排行榜

评论排行榜

推荐排行榜

最新评论