范仁义

2020年11月20日

201119西瓜书系列博客---16、强化学习

摘要： 201119西瓜书系列博客 16、强化学习一、总结一句话总结：强化学习（【Reinforcement Learning】，简称【RL】）是机器学习的一个重要分支，前段时间人机大战的主角【AlphaGo正是以强化学习为核心技术】。在强化学习中，包含两种基本的元素：【状态与动作】，【在某个状态下阅读全文

posted @ 2020-11-20 09:45 范仁义阅读(161) 评论(0) 推荐(0) 编辑

AlphaGo原理浅析

摘要： AlphaGo原理浅析一、总结一句话总结：正如人类下棋那般【“手下一步棋，心想三步棋”】，Alphago也正是这个思想【当处于一个状态时，机器会暗地里进行多次的尝试/采样】，并基于反馈回来的结果信息改进估值函数，从而最终通过增强版的估值函数来选择最优的落子动作。 1、AlphaGo的三大核心阅读全文

posted @ 2020-11-20 09:37 范仁义阅读(1649) 评论(0) 推荐(0) 编辑

201116西瓜书机器学习系列---16、强化学习

摘要： 201116西瓜书机器学习系列 16、强化学习一、总结一句话总结：【强化学习的应用非常非常广泛】【AlphaGo代表着双人完美信息零和游戏。AlphaGo在围棋这么难的问题上取得了举世瞩目的成绩；AlphaGo是人工智能的一个里程碑。】【Deepmind AlphaStar打败了星际争霸人阅读全文

posted @ 2020-11-20 02:50 范仁义阅读(120) 评论(0) 推荐(0) 编辑

2020年11月19日

201119西瓜书系列博客---13、半监督学习

摘要： 201119西瓜书系列博客 13、半监督学习一、总结一句话总结：【主动学习仍需交互】：显然，主动学习需要与外界进行交互/查询/打标，其本质上仍然属于一种监督学习。【无标记数据其实大有裨益】：事实上，无标记样本虽未包含标记信息，但它们与有标记样本一样都是【从总体中独立同分布采样得到】，因此它们阅读全文

posted @ 2020-11-19 23:00 范仁义阅读(115) 评论(0) 推荐(0) 编辑

201119西瓜书系列博客---14、概率图模型

摘要： 201119西瓜书系列博客 14、概率图模型一、总结一句话总结：机器学习的核心在于【根据一些已经观察到的证据(例如训练样本)来对未知变量进行估计和预测】。其中【基于概率的模型】将学习任务归结为【计算变量的概率分布】，正如之前已经提到的：【生成式模型先对联合分布进行建模，从而再来求解后验概率】阅读全文

posted @ 2020-11-19 08:35 范仁义阅读(149) 评论(0) 推荐(0) 编辑

201119西瓜书系列博客---15、规则学习

摘要： 201119西瓜书系列博客 15、规则学习一、总结一句话总结：【规则学习】是【从训练数据中】学习出一组【能用于对未见示例进行判别的规则】【规则】本身是一个【贪心的搜索过程】形式化地看，一条规则形如：$$\oplus \leftarrow f _ { 1 } \wedge f _ { 2 } 阅读全文

posted @ 2020-11-19 07:57 范仁义阅读(167) 评论(0) 推荐(0) 编辑

201116西瓜书机器学习系列---14、概率图模型

摘要： 201116西瓜书机器学习系列 14、概率图模型一、总结一句话总结：概率图模型：一类用【图】来【表达变量关系】的模型从【有向图模型】到【无向图模型】，到学习与推断 1、马尔科夫假设？概率图中各个状态的变化，【只与他的临近前一个状态相关】 $$P ( i _ { t } | i _ { 1 阅读全文

posted @ 2020-11-19 05:55 范仁义阅读(114) 评论(0) 推荐(0) 编辑

201116西瓜书机器学习系列---13、半监督学习

摘要： 201116西瓜书机器学习系列 13、半监督学习一、总结一句话总结：监督学习就是有feature有label，无监督学习只有feature没有label，半监督学习就是【部分数据有label，部分数据每有label】半监督学习和主动学习的区别是没有【专家系统】 1、半监督学习常用方法？可阅读全文

posted @ 2020-11-19 03:37 范仁义阅读(199) 评论(0) 推荐(0) 编辑

201116西瓜书机器学习系列---12、计算学习理论

摘要： 201116西瓜书机器学习系列 12、计算学习理论一、总结一句话总结：计算学习理论：研究【泛化误差】和【经验误差】之间的【逼近程度】 1、PAC可学习？ PAC可学习：以较大概率【预测】到【满足预测误差上限】的模型 2、量化假设空间的复杂度的方法？【VC维和Rademacher复杂度】 3、阅读全文

posted @ 2020-11-19 01:33 范仁义阅读(184) 评论(0) 推荐(0) 编辑

2020年11月18日

201116西瓜书机器学习系列---11、特征选择

摘要： 201116西瓜书机器学习系列 11、特征选择一、总结一句话总结：特征选择的【步骤】，特征选择的【方法】 1、稀疏学习？ 2、信息增益如何做特征选择？【信息增益越大，特征越重要】 3、过滤式特征选择：代表算法Relief（Relevant Feature）？ Relief原理：【能区分开目标阅读全文

posted @ 2020-11-18 20:25 范仁义阅读(199) 评论(0) 推荐(0) 编辑

在校每年国奖、每年专业第一，加拿大留学，先后工作于华东师范大学和香港教育大学

公告