摘要: (一)Noise会不会对VC bound产生影响? 此笔记源于台湾大学林轩田老师《机器学习基石》《机器学习技法》 答案是不会。 当信号中加入了Noise,其实对我们之前学过的内容不产生任何本质上的影响。 之前《机器学习真的起作用吗?》中的分析是基于:training dataset D的来源是:(x 阅读全文
posted @ 2016-04-27 15:19 wangyanphp 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 前两篇文章已经完成了大部分的工作,这篇文章主要是讲VC bound和 VC dimension这两个概念。 (一)前文的一点补充 根据前面的讨论,我们似乎只需要用来替代来源的M就可以了,但是实际公式却不是这样的,我们需要数学上处理几个小细节。具体的处理方法不讲,只提供大体思路。 可以看出,真实情况下 阅读全文
posted @ 2016-04-27 14:41 wangyanphp 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 一个问题:大多数情况下,M(hypothesis set的大小)是无穷大的,例如PLA算法。那么是不是我们的原则1就不能使用了? 我们试着做一些努力: Step1:寻找hypothesis set的effective number来代替M 什么意思呢?就是之前推导中,但是呢,例如在PLA算法中,h1 阅读全文
posted @ 2016-04-27 11:21 wangyanphp 阅读(540) 评论(0) 推荐(0) 编辑
摘要: [此笔记源于台湾大学林轩田老师《机器学习基石》《机器学习技法》] 机器学习真的可以起作用吗?答案是肯定的。 那为什么这个问题还要拿出来讲一讲呢? 考虑一个问题: 现在知道了5个数据,预测其余3个xn的输出,有如下可能: 我们根本没法预测! 这个问题formally的表示是:对于一个整体,我们随机抽取 阅读全文
posted @ 2016-04-27 11:07 wangyanphp 阅读(413) 评论(0) 推荐(0) 编辑
摘要: 此笔记源于台湾大学林轩田老师《机器学习基石》《机器学习技法》 (一) PLA算法是基本的binary Classification算法。 一个基本的问题是,对于银行,假设我知道用户的年龄、性别、工作、工资,那么应不应该发信用卡给他? 那么它在二维空间里就是一条分割平面的直线。 如何从拥有无限多h的H 阅读全文
posted @ 2016-04-26 21:15 wangyanphp 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 程序员学习汇编代码的需求随着时间的推移发生了变化,开始时只要求程序员能直接用汇编语言编写程序,现在则要求他们能够阅读和理解编译器产生的代码。 下面是针对32位机器 数据格式 Intel用术语“字”(word)表示16位数据类型,32位数称为双字(double words),64位数称为四字(quad 阅读全文
posted @ 2016-04-26 20:46 wangyanphp 阅读(455) 评论(0) 推荐(0) 编辑
摘要: 此笔记源于台湾大学林轩田老师《机器学习基石》《机器学习技法》 1. 在什么情况下使用机器学习? 如果可以编写程序解决,就不需要机器学习。 2. 什么样的问题才可以使用使用机器学习?(Key Essence of Machine Learning) 3. 几个常用概念(Notation) 4. 机器学 阅读全文
posted @ 2016-04-26 20:00 wangyanphp 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 2.65 int even_ones(unsigned x) 要求:return 1 when x contains an even number of 1s; 0 otherwise. 假设int 有 w=32位。 分析:最应该使用的是循环,但是循环语句不能使用。如果一个一个的写成语句,需要32次 阅读全文
posted @ 2015-09-21 11:20 wangyanphp 阅读(533) 评论(0) 推荐(0) 编辑
摘要: 在计算机中,使用位来存储信息。相同的位级表示,改变其解释方式,则表达出不同的信息。 0.位级运算中的异或 位级运算中需要注意的是异或这个运算,x^y异或的含义是:对于第i位,x,y在i位上的值不同时,结果为1;这意味着,在第i位上,x,y有且仅有一个1时,结果为1;有且仅有一个0时,结果为1;两者的 阅读全文
posted @ 2015-09-19 15:41 wangyanphp 阅读(883) 评论(0) 推荐(0) 编辑