会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
从流域到海域
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
8
9
10
···
31
下一页
2019年9月28日
从Markov Process到Markov Decision Process
摘要: Recall: Markov Property information state: sufficient statistic of...
阅读全文
posted @ 2019-09-28 20:15 从流域到海域
阅读(68)
评论(0)
推荐(0)
编辑
剑指Offer系列编程题详解全集
摘要: 剑指Offer系列是一本国内互联网公司计算机、软件、测试、运维等方向招聘笔试及面试经常会考的编程题合集,一共67道题,其中部分题...
阅读全文
posted @ 2019-09-28 20:11 从流域到海域
阅读(90)
评论(0)
推荐(0)
编辑
2019年9月26日
L1正则和L2正则的区别详解
摘要: 正则化本身是一种参数范数惩罚,即权重衰减。 L2参数正则化 L2参数正则化策略通过向目标函数添加一个正则项 ...
阅读全文
posted @ 2019-09-26 22:21 从流域到海域
阅读(701)
评论(0)
推荐(0)
编辑
协方差详解
摘要: 今天面算法,面试官问协方差是什么,因为平时基本可能用不到,所以一脸懵逼,今天来温习一下什么是协方差。 期望(Expection...
阅读全文
posted @ 2019-09-26 21:28 从流域到海域
阅读(801)
评论(0)
推荐(0)
编辑
2019年9月25日
牛顿法和梯度下降法的比较
摘要: 牛顿法和梯度下降法大家都很熟悉了,所以这里就不细讲了,直接总结两者的区别,这也是面试算法可能会问到的问题。 NameNote梯...
阅读全文
posted @ 2019-09-25 21:31 从流域到海域
阅读(259)
评论(0)
推荐(0)
编辑
2019年9月17日
C++ const各种用法总结
摘要: 转载自: https://www.toutiao.com/i6644404128439075332/,有删改。附参考:https...
阅读全文
posted @ 2019-09-17 20:02 从流域到海域
阅读(95)
评论(0)
推荐(0)
编辑
2019年8月30日
Exploration and Exploitation - 探索和利用
摘要: Exploration and Exploitation(探索和利用)是强化学习需要去平衡的一个点,即我应该去探索新的选项还是充...
阅读全文
posted @ 2019-08-30 11:41 从流域到海域
阅读(160)
评论(0)
推荐(0)
编辑
RL Algorithm Components - 强化学习算法组件
摘要: RL Algorithm Components 通常包括一个或者更多: Model(模型): world对agent的动作如何改变的...
阅读全文
posted @ 2019-08-30 10:17 从流域到海域
阅读(65)
评论(0)
推荐(0)
编辑
2019年8月29日
Sequential Decision Making under uncertain - 不确定性条件下的序列决策制定
摘要: Sequential Decision Making 序列决策制定可以被归纳为为下面的交互式闭环过程: 目标:选择能够最大化未来全...
阅读全文
posted @ 2019-08-29 21:27 从流域到海域
阅读(141)
评论(0)
推荐(0)
编辑
强化学习简介
摘要: 强化学习 How can an intelligent agent learn to make good sequences of ...
阅读全文
posted @ 2019-08-29 16:28 从流域到海域
阅读(91)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
8
9
10
···
31
下一页
公告