随笔分类 - machine learning
摘要:根据网上的相关博客总结了一下机器学习中的这两个概念,参考博客见文末。生成模型:无穷样本==》概率密度模型 = 生成模型==》预测判别模型:有限样本==》判别函数 = 预测模型==》预测机器学习中的模型一般分为两类:判别模型、生成模型,这是对问题的两种不同的审视角度。假设我们要学习一个算法区分大象和狗...
阅读全文
摘要:简单的以下面曲线拟合例子来讲:直线拟合后,相比原来的点偏差最大,最后一个图完全拟合了数据点偏差最小;但是拿第一个直线模型去预测未知数据,可能会相比最后一个模型更准确,因为最后一个模型过拟合了,即第一个模型的方差比最后一个模型小。一般而言高偏差意味着欠拟合,高方差意味着过拟合。他们之间有如下的关系: ...
阅读全文
摘要:How do you know what machine learning algorithm to choose for your classification problem? Of course, if you really care about accuracy, your best bet...
阅读全文
摘要:目录:一、L0,L1范数二、L2范数三、核范数今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问题。这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文。知识有限,以下都是我一些浅显的看法,...
阅读全文