随笔分类 -  机器学习(转载)

摘要:损失函数:Hinge Loss(max margin) Hinge Loss简介 Hinge Loss是一种目标函数(或者说损失函数)的名称,有的时候又叫做max-margin objective。其最著名的应用是作为SVM的目标函数。 其二分类情况下,公式如下: l(y)=max(0,1−t⋅y) 阅读全文
摘要:余弦距离、欧氏距离和杰卡德相似性度量的对比分析 1、余弦距离 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。 向量,是多维空间中有方向的线段,如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。而要确定两个向量方向是否一致,这就要用到余弦定 阅读全文
摘要:分类问题损失函数的信息论解释 分类问题的优化过程是一个损失函数最小化的过程,对应的损失函数一般称为logloss,对于一个多分类问题,其在N个样本上的logloss损失函数具有以下形式: 其中,yi(n)代表第n个样本是否属于第i个类别,取值为0或1,f(x(n))i代表分类模型对于第n个样本属于第 阅读全文
摘要:什么是协变量 http://hi.baidu.com/flykite083/blog/item/920f56636e803b640c33facb.html http://www.cnblogs.com/ysjxw/archive/2008/05/28/1209033.html I've found 阅读全文
摘要:Why The Golden Age Of Machine Learning is Just BeginningEven though the buzz around neural networks, artificial intelligence, and machine learning has... 阅读全文
摘要:Lessons Learned from Developing a Data ProductFor an assignment I was asked to develop a visual ‘data product’ that informed decisions on video game r... 阅读全文
摘要:8 Productivity hacks for Data Scientists & Business AnalystsIntroductionI was catching up with one of my friends from a past organization. She had alw... 阅读全文
摘要:Logistic Regression – Geometric IntuitionEverybody who has taken amachine learning course probably knows the geometric intuitionbehinda support vector... 阅读全文
阅读全文
摘要:PCA的数学原理PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的... 阅读全文
摘要:Brief History of Machine LearningMy subjective ML timelineSincethe initialstandpoint of science, technology and AI, scientists following Blaise Pascal... 阅读全文
摘要:Comparing Differently TrainedModelsAt the end of the previous post, we mentioned that the solution found by L-BFGS made different errors compared to t... 阅读全文
摘要:14种机器学习常见算法分类汇总机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两... 阅读全文
摘要:皮尔逊积矩相关系数的学习做相似度计算的时候经常会用到皮尔逊相关系数(Pearson Correlation Coefficient),那么应该如何理解该系数?其数学本质、含义是什么? 皮尔逊相关系数理解有两个角度 一、以高中课本为例,将两组数据首先做Z分数处理之后,然后两组数据的乘积和除以样本数。 ... 阅读全文
摘要:The Difference Between Big Data and a Lot of DataThe term “big data” has been around for a while now, but I still come across people who make the same... 阅读全文
摘要:15 Most Read Data Science Articles in 2015. So far …We've compiled the latest set of "most read" articles from the Data Science Weekly Newsletter. Thi... 阅读全文
摘要:11 Facts about Data Science that you must knowStatistics, Machine Learning, Data Science, or Analytics – whatever you call it, this discipline is on r... 阅读全文
摘要:为什么统计学家、机器学习专家解决同一问题的方法差别那么大?作者:Nir Kaldero乍一看,机器学习和统计似乎是非常相似的,大家几乎不强调这两个学科之间的差异。机器学习和统计有着相同的目标 ——它们都关注数据建模,但他们的使用方法却因为它们文化的差异而截然不同。为了能够更好的协作和知识创新,了解这... 阅读全文
