上一页 1 2 3 4 5 6 7 8 9 10 ··· 31 下一页
摘要: Recall: Markov Property information state: sufficient statistic of... 阅读全文
posted @ 2019-09-28 20:15 从流域到海域 阅读(68) 评论(0) 推荐(0) 编辑
摘要: 剑指Offer系列是一本国内互联网公司计算机、软件、测试、运维等方向招聘笔试及面试经常会考的编程题合集,一共67道题,其中部分题... 阅读全文
posted @ 2019-09-28 20:11 从流域到海域 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 正则化本身是一种参数范数惩罚,即权重衰减。 L2参数正则化 L2参数正则化策略通过向目标函数添加一个正则项 ... 阅读全文
posted @ 2019-09-26 22:21 从流域到海域 阅读(701) 评论(0) 推荐(0) 编辑
摘要: 今天面算法,面试官问协方差是什么,因为平时基本可能用不到,所以一脸懵逼,今天来温习一下什么是协方差。 期望(Expection... 阅读全文
posted @ 2019-09-26 21:28 从流域到海域 阅读(801) 评论(0) 推荐(0) 编辑
摘要: 牛顿法和梯度下降法大家都很熟悉了,所以这里就不细讲了,直接总结两者的区别,这也是面试算法可能会问到的问题。 NameNote梯... 阅读全文
posted @ 2019-09-25 21:31 从流域到海域 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 转载自: https://www.toutiao.com/i6644404128439075332/,有删改。附参考:https... 阅读全文
posted @ 2019-09-17 20:02 从流域到海域 阅读(95) 评论(0) 推荐(0) 编辑
摘要: Exploration and Exploitation(探索和利用)是强化学习需要去平衡的一个点,即我应该去探索新的选项还是充... 阅读全文
posted @ 2019-08-30 11:41 从流域到海域 阅读(160) 评论(0) 推荐(0) 编辑
摘要: RL Algorithm Components 通常包括一个或者更多: Model(模型): world对agent的动作如何改变的... 阅读全文
posted @ 2019-08-30 10:17 从流域到海域 阅读(65) 评论(0) 推荐(0) 编辑
摘要: Sequential Decision Making 序列决策制定可以被归纳为为下面的交互式闭环过程: 目标:选择能够最大化未来全... 阅读全文
posted @ 2019-08-29 21:27 从流域到海域 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 强化学习 How can an intelligent agent learn to make good sequences of ... 阅读全文
posted @ 2019-08-29 16:28 从流域到海域 阅读(91) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 31 下一页