摘要:
201119西瓜书系列博客 13、半监督学习 一、总结 一句话总结: 【主动学习仍需交互】:显然,主动学习需要与外界进行交互/查询/打标,其本质上仍然属于一种监督学习。 【无标记数据其实大有裨益】:事实上,无标记样本虽未包含标记信息,但它们与有标记样本一样都是【从总体中独立同分布采样得到】,因此它们 阅读全文
摘要:
201119西瓜书系列博客 14、概率图模型 一、总结 一句话总结: 机器学习的核心在于【根据一些已经观察到的证据(例如训练样本)来对未知变量进行估计和预测】。 其中【基于概率的模型】将学习任务归结为【计算变量的概率分布】,正如之前已经提到的:【生成式模型先对联合分布进行建模,从而再来求解后验概率】 阅读全文
摘要:
201119西瓜书系列博客 15、规则学习 一、总结 一句话总结: 【规则学习】是【从训练数据中】学习出一组【能用于对未见示例进行判别的规则】 【规则】本身是一个【贪心的搜索过程】 形式化地看,一条规则形如:$$\oplus \leftarrow f _ { 1 } \wedge f _ { 2 } 阅读全文
摘要:
201116西瓜书机器学习系列 14、概率图模型 一、总结 一句话总结: 概率图模型:一类用【图】来【表达变量关系】的模型 从【有向图模型】到【无向图模型】,到学习与推断 1、马尔科夫假设? 概率图中各个状态的变化,【只与他的临近前一个状态相关】 $$P ( i _ { t } | i _ { 1 阅读全文
摘要:
201116西瓜书机器学习系列 13、半监督学习 一、总结 一句话总结: 监督学习就是有feature有label,无监督学习只有feature没有label,半监督学习就是【部分数据有label,部分数据每有label】 半监督学习和主动学习的区别是没有【专家系统】 1、半监督学习 常用方法? 可 阅读全文
摘要:
201116西瓜书机器学习系列 12、计算学习理论 一、总结 一句话总结: 计算学习理论:研究【泛化误差】和【经验误差】之间的【逼近程度】 1、PAC可学习? PAC可学习:以较大概率【预测】到【满足预测误差上限】的模型 2、量化假设空间的复杂度的方法? 【VC维和Rademacher复杂度】 3、 阅读全文