随笔分类 - 机器学习
摘要:学习了两篇博客,存下来以免丢失。 http://blog.csdn.net/losteng/article/details/50893739 https://leileiluoluo.com/posts/kdtree-algorithm-and-implementation.html
阅读全文
摘要:经过这一段时间学习,发现ML in Action这本书确实是侧重代码方面,关于数学推导方面还是很少,需要不断查看文档。 链接: 贝叶斯网络、拉普拉斯平滑 链接: Naive Bayes 看完拉普拉斯平滑后,我觉得书上有问题,就是防止概率中有0的时候,分子每项加一,它写的分母 p0Denom = 2.
阅读全文
摘要:代码还好懂,但是后面选择更好的划分数据集的方法,有点不知道为什么那样选。 还要好好理解推导。 append和extend区别: 1月18日 今天上午从 网上搜了一些其他人的笔记,加上自己思考,才明白这里要干什么,书上推导部分都省略了。 关于条件熵: http://blog.csdn.net/xwd1
阅读全文
摘要:1.算法工作原理 存在一个训练样本集,我们知道样本集中的每一个数据与所属分类的对应关系,输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应特征进行比较,然后算法提取样本集中特征最相似的数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处
阅读全文