上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 45 下一页
摘要: 本文主要基于Anand Rajaraman和Jeffrey David Ullman合著,王斌翻译的《大数据-互联网大规模数据挖掘与分布式处理》一书。KMeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中... 阅读全文
posted @ 2015-09-17 16:53 止战 阅读(22033) 评论(1) 推荐(1) 编辑
摘要: 原文:http://blog.csdn.net/shiwei408/article/details/7602324在做分类时常常需要估算不同样本之间的相似性度量(SimilarityMeasurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很... 阅读全文
posted @ 2015-09-15 23:28 止战 阅读(341) 评论(0) 推荐(0) 编辑
摘要: 原文:http://peghoty.blog.163.com/blog/static/49346409201302595935709/正确率、召回率和 F 值是在鱼龙混杂的环境中,选出目标的重要评价指标。不妨看看这些指标的定义先: 1. 正确率 = 正确识别的个体总数 / 识别出的个体总数 2. 召... 阅读全文
posted @ 2015-09-15 17:20 止战 阅读(1576) 评论(0) 推荐(0) 编辑
摘要: 原文:http://blog.csdn.net/buptgshengod/article/details/46819051首先还是要声明一下,这个文章是我在入职阿里云1个月以来,对于分布式计算的一点肤浅的认识,可能有些地方不够妥善,还请看官可以指出不足的地方,共同进步。一.背景随着互联网的发展,数据... 阅读全文
posted @ 2015-09-12 19:39 止战 阅读(592) 评论(0) 推荐(0) 编辑
摘要: 原文:http://dataunion.org/13451.html作者:xbinworld引言:机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。 y是数据... 阅读全文
posted @ 2015-09-12 15:15 止战 阅读(937) 评论(0) 推荐(0) 编辑
摘要: 原文:http://luowei828.blog.163.com/blog/static/310312042013101401524824通常而言,损失函数由损失项(loss term)和正则项(regularization term)组成。发现一份不错的介绍资料:http://www.ics.uc... 阅读全文
posted @ 2015-09-12 14:05 止战 阅读(946) 评论(0) 推荐(0) 编辑
摘要: 原文:http://segmentfault.com/a/1190000002472791朴素贝叶斯(Naive Bayes Classifier)是一种「天真」的算法(假定所有特征发生概率是独立的),同时也是一种简单有效的常用分类算法。关于它的原理,参见朴素贝叶斯分类器的应用。scikit-lea... 阅读全文
posted @ 2015-09-09 21:32 止战 阅读(816) 评论(0) 推荐(0) 编辑
摘要: 原文:http://blog.csdn.net/u012162613/article/details/44261657本文是《Neural networks and deep learning》概览中第三章的一部分,讲机器学习/深度学习算法中常用的正则化方法。(本文会不断补充)正则化方法:防止过拟合... 阅读全文
posted @ 2015-09-06 23:36 止战 阅读(364) 评论(0) 推荐(0) 编辑
摘要: http://blog.renren.com/share/223170925/14708690013常用显著性检验 1.t检验 适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。 2.t'检验 应用条件与t检... 阅读全文
posted @ 2015-09-05 22:12 止战 阅读(18912) 评论(0) 推荐(1) 编辑
摘要: 原文:http://tech.meituan.com/mt-mlinaction-how-to-ml.html前言随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学... 阅读全文
posted @ 2015-08-29 17:24 止战 阅读(435) 评论(0) 推荐(0) 编辑
上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 45 下一页