微信扫一扫打赏支持
摘要: 201119西瓜书系列博客 4、决策树 一、总结 一句话总结: 决策树学习的【目的是为了产生一棵泛化能力强】,即处理未见示例能力强的决策树,其基本流程遵循简单且直观的【分而治之(divide-and-conquer)】策略。 1、决策树的结构? 一般的,决策树包含一个【根结点,多个内部结点和多个叶结 阅读全文
posted @ 2020-11-20 23:16 范仁义 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 201119西瓜书系列博客 3、线性模型 一、总结 一句话总结: 线性模型:试图学得一个通过属性的线性组合来进行预测的函数,即:$$f ( x ) = w _ { 1 } x _ { 1 } + w _ { 2 } x _ { 2 } + \ldots + w _ { d } x _ { d } + 阅读全文
posted @ 2020-11-20 22:39 范仁义 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 201119西瓜书系列博客 2、模型评估与选择 一、总结 一句话总结: 要善于凭借,这样万利无害 1、【2.2、学习器泛化误差评估方法】 留出法? 【“留出法”(hold-out)直接将数据集D划分为两个互斥的集合】,其中一个集合作为训练集S,另一个作为测试集T,即D=S∪T,S∩T=Φ。在S上训练 阅读全文
posted @ 2020-11-20 22:23 范仁义 阅读(135) 评论(0) 推荐(0) 编辑
摘要: legend3 阿里云中买的服务器配置HTTPS证书(201120) 一、总结 一句话总结: 如果是【网站配置https】,就是【下载证书放apache,配置apache的那一套】,如果这个时候开了cdn加速,还要去cdn里面配置一下证书 如果是【cdn配置https】,则【直接在cdn的https 阅读全文
posted @ 2020-11-20 12:10 范仁义 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 201119西瓜书系列博客 1、绪论 一、总结 一句话总结: 要善于凭借,这样万利无害 1、为什么未标记的数据照样很有用? 通常假设样本空间中全体样本服从某个未知分布,我们获得的每个样本都是独立地从这个分布上采样获得的【(即“独立同分布”)】 一般而言:【训练样本越多 ——> 得到关于该未知分布的信 阅读全文
posted @ 2020-11-20 10:11 范仁义 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 201119西瓜书系列博客 16、强化学习 一、总结 一句话总结: 强化学习(【Reinforcement Learning】,简称【RL】)是机器学习的一个重要分支,前段时间人机大战的主角【AlphaGo正是以强化学习为核心技术】。 在强化学习中,包含两种基本的元素:【状态与动作】,【在某个状态下 阅读全文
posted @ 2020-11-20 09:45 范仁义 阅读(141) 评论(0) 推荐(0) 编辑
摘要: AlphaGo原理浅析 一、总结 一句话总结: 正如人类下棋那般【“手下一步棋,心想三步棋”】,Alphago也正是这个思想 【当处于一个状态时,机器会暗地里进行多次的尝试/采样】,并基于反馈回来的结果信息改进估值函数,从而最终通过增强版的估值函数来选择最优的落子动作。 1、AlphaGo的三大核心 阅读全文
posted @ 2020-11-20 09:37 范仁义 阅读(1506) 评论(0) 推荐(0) 编辑
摘要: 201116西瓜书机器学习系列 16、强化学习 一、总结 一句话总结: 【强化学习的应用非常非常广泛】 【AlphaGo代表着双人完美信息零和游戏。AlphaGo在围棋这么难的问题上取得了举世瞩目的成绩;AlphaGo是人工智能的一个里程碑。】 【Deepmind AlphaStar打败了星际争霸人 阅读全文
posted @ 2020-11-20 02:50 范仁义 阅读(118) 评论(0) 推荐(0) 编辑