随笔分类 -  机器学习

摘要:此课在网易公开课上的名字是“机器学习的动机和应用”,而在官网上叫CS229: Machine Learning,就是机器学习 主讲人:Andrew Ng 教授 主要工具,matlab和Octave,前者收费,后者具有前者大部分功能,但免费。此课用后者已经足够。 有学生问能否用C或Java来写此课的程 阅读全文
posted @ 2018-05-26 13:30 火军刀 阅读(211) 评论(0) 推荐(0) 编辑
摘要:此文旨在把trainNB0这个函数详细讲清楚。 下面所做的工作都是为了求下面这个贝叶斯概率,也叫条件概率: 为了计算方便,书中的操作实际上是把这个式子转化为了下式: 概率P(ci)就是通过类别i(侮辱性留言或非侮辱性留言)中文档数除以总的文档数来得到的,也就是最后得到的计算结果0.5。 这里有一个重 阅读全文
posted @ 2018-02-25 17:11 火军刀 阅读(547) 评论(0) 推荐(0) 编辑
摘要:这一节中关于概率分布的描述,省略了一些语句,所以有点看不明白,经过反复推敲琢磨分析以后,把这些省略的文字补足,这样就能看懂了。【】中为补充的文字。 文中的“需要”的意思是“需要足够的数据样本来得到好的概率分布” 假设词汇表中有1000个单词。要得到好的概率分布,就需要足够的数据样本,假定样本数为N, 阅读全文
posted @ 2018-02-23 02:16 火军刀 阅读(268) 评论(0) 推荐(0) 编辑
摘要:这个plotTree函数,比较聪明,比较简化,比较抽象,作者一定是逐步优化和简化到这个程度的。我是花了小两天时间,断断续续看明白的,还是在参考了另一篇文章以后。这里是链接http://www.cnblogs.com/fantasy01/p/4595902.html。现在尝试讲明白。 总体思想是,找出 阅读全文
posted @ 2018-02-09 01:56 火军刀 阅读(1667) 评论(0) 推荐(0) 编辑
摘要:matplotlib.pyplot是一个命令行风格的函数集合,使matplotlib像MATLAB一样工作。每个pyplot 函数会对图形窗口(figure)做一些改变,例如:创建一个图形窗口、在图形窗口上创建一个绘图区(plotting area)、在绘图区上画一些线条、在线条上标注说明文字等等。 阅读全文
posted @ 2018-02-06 23:57 火军刀 阅读(599) 评论(0) 推荐(0) 编辑
摘要:有点乱,等我彻底想明白时再来整理清楚。 阅读全文
posted @ 2018-02-05 00:30 火军刀 阅读(784) 评论(0) 推荐(0) 编辑
摘要:splitDataSet这个函数困扰了我好一阵子,为什么以某一特征值为标准进行划分数据集以后,变成了局部?例如,如果以第1个特征为0为标准进行划分,那么返回的结果集就是不含有此特征的结果集,如下图红框部分所示: 代码表示为:[[1, 'no'], [1, 'no']] 同理,如果以第1个特征为1作为 阅读全文
posted @ 2018-02-02 20:45 火军刀 阅读(945) 评论(0) 推荐(0) 编辑
摘要:以下输出结果是每个样本的类别都不同时的输出结果: 样本总数:8当前labelCounts状态:{'1': 1}当前labelCounts状态:{'1': 1, '2': 1}当前labelCounts状态:{'1': 1, '2': 1, '3': 1}当前labelCounts状态:{'1': 1 阅读全文
posted @ 2018-02-01 19:31 火军刀 阅读(2205) 评论(0) 推荐(0) 编辑
摘要:这段代码,如果仅启用 就会在 b = open("trainingDigits/0_0.txt") 这个位置报 TypeError: Required argument 'flags' (pos 2) not found这个错 如果仅启用 就会在a = listdir("trainingDigits 阅读全文
posted @ 2018-01-30 19:57 火军刀 阅读(1393) 评论(0) 推荐(0) 编辑
摘要:以下代码,在Sublime中跑不起来,似乎Sublime无法交互输入文字,在IDLE或控制台中可以输入。 测试结果其实也挺搞笑的,这姑娘的喜好唯一取决于每周吃多少冰淇淋,前两项输入0,第三项输入236,就是small does,输入237,就是large doses。 所以,一个不玩游戏,不是飞行常 阅读全文
posted @ 2018-01-29 16:51 火军刀 阅读(334) 评论(0) 推荐(0) 编辑
摘要:所以,第三个参数不能超过前两个的乘积,如果用fig.add_subplot(a,b,c)来表示的话,ab>=c,否则会报错。 对于fig.add_subplot(3,4,12)这个函数,官方网站的解释似乎有点问题,链接https://matplotlib.org/api/_as_gen/matplo 阅读全文
posted @ 2018-01-27 21:34 火军刀 阅读(838) 评论(0) 推荐(0) 编辑
摘要:将文本记录转换为NumPy的解析程序 阅读全文
posted @ 2018-01-27 15:57 火军刀 阅读(230) 评论(0) 推荐(0) 编辑
摘要:《机器学习实践》侧重与讲解机器学习的算法,对于不熟悉Python语言的同学来讲,有些语言特性还是需要进一步了解。本文以及后续的文章,希望把每一个算法进行逐一拆解。 阅读全文
posted @ 2018-01-26 12:54 火军刀 阅读(563) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示