随笔分类 - 机器学习(转载)
摘要:机器学习是什么不久以前读的一篇好文,主要是讲机器学习到底是属于什么学科或者研究领域,同时也介绍到了ML与AI之间的关系。作者是南京大学的周志华老师。废话少说,直接上文章。------------------------------------------------------- 机器学习现在是...
阅读全文
摘要:18大经典数据挖掘算法小结本文所有涉及到的数据挖掘代码的都放在了我的github上了。地址链接:https://github.com/linyiqun/DataMiningAlgorithm大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,...
阅读全文
摘要:多种相似距离对比因某些原因需要对样本进行相似度方面的计算,对常见的几种距离公式进行了一系列实验。距离公式:距离的衡量在相似度衡量中占据了重要的地位,不同的距离公式有其不同的应用场景,都是为了解决某类问题而诞生的,本文期望对这些距离公式能有个”0距离”的亲密接触。目录1. 欧氏距离2. 切比雪夫距离3...
阅读全文
摘要:机器学习中的相似性度量在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:...
阅读全文
摘要:[machine learning] Loss Function view有关Loss Function(LF),只想说,终于写了一、Loss Function什么是Loss Function?wiki上有一句解释我觉得很到位,引用一下:The loss function quantifies th...
阅读全文
摘要:K-means的缺点(优化不仅仅是最小化误差)#转载时,请注明英文原作David Robinson,译者Ding Chao。#我最近遇到一个交叉验证的问题,我认为这个给我提供了一个很好的机会去用“R”和“ggplot2”探索下K-means算法的一些基本假设。K-means方法广泛用于聚类分析。可是...
阅读全文
摘要:What are the advantages of different classification algorithms?For instance, if we have large training data set with approx more than 10000 instances ...
阅读全文
摘要:Understanding the Bias-Variance TradeoffWhen we discuss prediction models, prediction errors can be decomposed into two main subcomponents we care abo...
阅读全文
摘要:Your Prediction Gets As Good As Your DataMay 5, 2015 by KazemIn the past, we have seen software engineers and data scientists assume that they can kee...
阅读全文
摘要:Extreme Learning Machine(ELM)的工程哲学David_Wang2015发布于2015年5月6日 11:29 工程问题往往需要的是一定精度范围内的结果,而不是“真正的”结果。得到问题解的一般方式是迭代求解,而ELM的求解方式是利用随机数和大数定律求解,这种方法论在20世纪...
阅读全文
摘要:ON THE EVOLUTION OF MACHINE LEARNING: FROM LINEAR MODELS TO NEURAL NETWORKSWe recently interviewed Reza Zadeh (@Reza_Zadeh). Reza is a Consulting Prof...
阅读全文
摘要:【深度】机器学习进化史:从线性模型到神经网络Reza Zadeh是斯坦福大学工程计算和数学研究所顾问教授,也是Databricks公司技术顾问,他主要专注于机器学习理论和应用,分布式计算,以及离散应用数学。近日,他接受了oreilly网站的采访,尝试谈论了人工智能的各方面。神经网络已卷土重来,并且作...
阅读全文
摘要:Logistic Regression and Gradient DescentLogistic regression is an excellent tool to know for classification problems. Classification problems are prob...
阅读全文
摘要:Common Pitfalls In Machine Learning ProjectsIn a recent presentation,Ben Hamnerdescribedthe common pitfalls in machine learning projects he and his co...
阅读全文
摘要:Practical Machine Learning For The UninitiatedLast fall when Itook on ShippingEasy’s machine learning problem, I had no practical experience in the fi...
阅读全文
摘要:Machine Learning Methods: Decision trees and forestsThis post contains our crib notes on the basics of decision trees and forests. We first discuss th...
阅读全文
摘要:The mean shift clustering algorithmMEAN SHIFT CLUSTERINGMean shift clustering is a general non-parametric cluster finding procedure — introduced by Fu...
阅读全文
摘要:https://jmetzen.github.io/2015-01-29/ml_advice.htmlAdvice for applying Machine LearningThis post is based on a tutorial given in a machine learning co...
阅读全文