摘要:
hoeffding 不等式 说明了在样本量足够大时,抽样估计能够接近真实值。 类比到ml中,对给定的一个假设空间中的h, 它在整个样本空间中的表现可以由在部分样本点上的表现来近似。也就是说样本足够多的时候,Ein与Eout近似相等。 现在已经知道对任意给定的h,在N足够大时,Ein近似于Eout,如 阅读全文
摘要:
介绍了机器学习中的几类问题划分。 半监督学习能够避免标记成本昂贵的问题。 强化学习,可以看做是从反馈机制中来学习。 在线学习,数据一个接一个地产生并交给算法模型线上迭代。 主动学习,机器能针对自己没有信心的数据提问,得到答案后再学习。 针对特征空间也有分类,比如具体的特征、原始的(个人理解是人为可提 阅读全文
摘要:
感知机学习,从二分类问题引入。 perceptron的思想其实来自于神经元。当刺激超过某一阈值时,神经元被激活。 把刺激程度表示为变量的线性组合,与阈值比较,确定分类。 对h(x)的形式简化 形如上式的h(x)的全体就是一个假设集合H. 接下来的需要使用一种演算法找出H里面最好的h来模拟真实的分类函 阅读全文
摘要:
什么时候适合用机器学习来解决问题? 存在潜在的规律用于学习 但是使用编程定义这种规律困难 存在包含这些规律的数据 机器学习的一种描述: 通过数据D,一个假设的集合H以及一种演算法A,找到集合H中的某个假设g,来逼近真实函数f. A takes D and H to get g. 什么时候适合用机器学 阅读全文