随笔分类 - 机器学习
摘要:此课在网易公开课上的名字是“机器学习的动机和应用”,而在官网上叫CS229: Machine Learning,就是机器学习 主讲人:Andrew Ng 教授 主要工具,matlab和Octave,前者收费,后者具有前者大部分功能,但免费。此课用后者已经足够。 有学生问能否用C或Java来写此课的程
阅读全文
摘要:此文旨在把trainNB0这个函数详细讲清楚。 下面所做的工作都是为了求下面这个贝叶斯概率,也叫条件概率: 为了计算方便,书中的操作实际上是把这个式子转化为了下式: 概率P(ci)就是通过类别i(侮辱性留言或非侮辱性留言)中文档数除以总的文档数来得到的,也就是最后得到的计算结果0.5。 这里有一个重
阅读全文
摘要:这一节中关于概率分布的描述,省略了一些语句,所以有点看不明白,经过反复推敲琢磨分析以后,把这些省略的文字补足,这样就能看懂了。【】中为补充的文字。 文中的“需要”的意思是“需要足够的数据样本来得到好的概率分布” 假设词汇表中有1000个单词。要得到好的概率分布,就需要足够的数据样本,假定样本数为N,
阅读全文
摘要:这个plotTree函数,比较聪明,比较简化,比较抽象,作者一定是逐步优化和简化到这个程度的。我是花了小两天时间,断断续续看明白的,还是在参考了另一篇文章以后。这里是链接http://www.cnblogs.com/fantasy01/p/4595902.html。现在尝试讲明白。 总体思想是,找出
阅读全文
摘要:matplotlib.pyplot是一个命令行风格的函数集合,使matplotlib像MATLAB一样工作。每个pyplot 函数会对图形窗口(figure)做一些改变,例如:创建一个图形窗口、在图形窗口上创建一个绘图区(plotting area)、在绘图区上画一些线条、在线条上标注说明文字等等。
阅读全文
摘要:有点乱,等我彻底想明白时再来整理清楚。
阅读全文
摘要:splitDataSet这个函数困扰了我好一阵子,为什么以某一特征值为标准进行划分数据集以后,变成了局部?例如,如果以第1个特征为0为标准进行划分,那么返回的结果集就是不含有此特征的结果集,如下图红框部分所示: 代码表示为:[[1, 'no'], [1, 'no']] 同理,如果以第1个特征为1作为
阅读全文
摘要:以下输出结果是每个样本的类别都不同时的输出结果: 样本总数:8当前labelCounts状态:{'1': 1}当前labelCounts状态:{'1': 1, '2': 1}当前labelCounts状态:{'1': 1, '2': 1, '3': 1}当前labelCounts状态:{'1': 1
阅读全文
摘要:这段代码,如果仅启用 就会在 b = open("trainingDigits/0_0.txt") 这个位置报 TypeError: Required argument 'flags' (pos 2) not found这个错 如果仅启用 就会在a = listdir("trainingDigits
阅读全文
摘要:以下代码,在Sublime中跑不起来,似乎Sublime无法交互输入文字,在IDLE或控制台中可以输入。 测试结果其实也挺搞笑的,这姑娘的喜好唯一取决于每周吃多少冰淇淋,前两项输入0,第三项输入236,就是small does,输入237,就是large doses。 所以,一个不玩游戏,不是飞行常
阅读全文
摘要:所以,第三个参数不能超过前两个的乘积,如果用fig.add_subplot(a,b,c)来表示的话,ab>=c,否则会报错。 对于fig.add_subplot(3,4,12)这个函数,官方网站的解释似乎有点问题,链接https://matplotlib.org/api/_as_gen/matplo
阅读全文
摘要:《机器学习实践》侧重与讲解机器学习的算法,对于不熟悉Python语言的同学来讲,有些语言特性还是需要进一步了解。本文以及后续的文章,希望把每一个算法进行逐一拆解。
阅读全文