摘要: 理论基础 knn是k近邻算法(k-nearest neighbor),可以用在分类,回归当中。这里讨论一下分类问题。 knn是一种基于实例的学习,在训练的时候只是把数据加载进去,预测的时候基于已经加载的数据预测出输入实例的标签。预测的策略是:采用距离这个实例最近的k个数据的标签。 所以这里涉及到一些 阅读全文
posted @ 2018-04-25 23:09 小舔哥 阅读(653) 评论(0) 推荐(0) 编辑
摘要: 概率条件下的期望风险最小化 贝叶斯分类器是从统计学和概率论的角度来研究机器学习的,我们假设各种分布概率是已知的。 我们以 $X$表示样本空间,$Y$表示类标记空间。$Y=\{ c_1,c_2,…,c_N\}$。 这里的$X$已经不仅仅是我们观察到的数据样本的集合了,而是所有可能的数据的集合。 以$\ 阅读全文
posted @ 2018-04-25 15:51 小舔哥 阅读(1519) 评论(0) 推荐(0) 编辑