从流域到海域

摘要： Recall: Markov Property information state: sufficient statistic of... 阅读全文

posted @ 2019-09-28 20:15 从流域到海域阅读(68) 评论(0) 推荐(0) 编辑

摘要：剑指Offer系列是一本国内互联网公司计算机、软件、测试、运维等方向招聘笔试及面试经常会考的编程题合集，一共67道题，其中部分题... 阅读全文

posted @ 2019-09-28 20:11 从流域到海域阅读(90) 评论(0) 推荐(0) 编辑

摘要：正则化本身是一种参数范数惩罚，即权重衰减。 L2参数正则化 L2参数正则化策略通过向目标函数添加一个正则项 ... 阅读全文

posted @ 2019-09-26 22:21 从流域到海域阅读(701) 评论(0) 推荐(0) 编辑

摘要：今天面算法，面试官问协方差是什么，因为平时基本可能用不到，所以一脸懵逼，今天来温习一下什么是协方差。期望(Expection... 阅读全文

posted @ 2019-09-26 21:28 从流域到海域阅读(801) 评论(0) 推荐(0) 编辑

摘要：牛顿法和梯度下降法大家都很熟悉了，所以这里就不细讲了，直接总结两者的区别，这也是面试算法可能会问到的问题。 NameNote梯... 阅读全文

posted @ 2019-09-25 21:31 从流域到海域阅读(259) 评论(0) 推荐(0) 编辑

摘要：转载自: https://www.toutiao.com/i6644404128439075332/，有删改。附参考：https... 阅读全文

posted @ 2019-09-17 20:02 从流域到海域阅读(95) 评论(0) 推荐(0) 编辑

摘要： Exploration and Exploitation(探索和利用)是强化学习需要去平衡的一个点，即我应该去探索新的选项还是充... 阅读全文

posted @ 2019-08-30 11:41 从流域到海域阅读(160) 评论(0) 推荐(0) 编辑

摘要： RL Algorithm Components 通常包括一个或者更多： Model(模型): world对agent的动作如何改变的... 阅读全文

posted @ 2019-08-30 10:17 从流域到海域阅读(65) 评论(0) 推荐(0) 编辑

摘要： Sequential Decision Making 序列决策制定可以被归纳为为下面的交互式闭环过程：目标：选择能够最大化未来全... 阅读全文

posted @ 2019-08-29 21:27 从流域到海域阅读(141) 评论(0) 推荐(0) 编辑

摘要：强化学习 How can an intelligent agent learn to make good sequences of ... 阅读全文

posted @ 2019-08-29 16:28 从流域到海域阅读(91) 评论(0) 推荐(0) 编辑