摘要:
课件 : "Lecture 1: Introduction to Reinforcement Learning" 视频 : "David Silver深度强化学习第1课 简介 (中文字幕)" 强化学习的特征 作为机器学习的一个分支,强化学习主要的特征为: 无监督,仅有奖励信号; 反馈有延迟,不是瞬时 阅读全文
欢迎访问我的个人博客: orzyt.cn
最新评论
- 1. Re:【论文笔记】Domain Adaptation via Transfer Component Analysis
- 博主你好,文章写的很好,特别是几个【注】的地方解决了我不少疑惑,但是我有个问题想请教下:在问题的一开始,我们在寻找一个核映射(目的是映射之后两个domain最接近),但是问题最后我们求解一个最优化的时...
- --落难的面条王子
- 2. Re:【论文笔记】Domain Adaptation via Transfer Component Analysis
- 尊敬的博主,您好。请问 KL的结果是一个和K相同形状的矩阵吗?MMD公式我弄明白了,但 tr(KL)没太明白。
- --MuggleD
- 3. Re:《构建之法》读书笔记
- 引用书中的注释都放在每一章的最后,感觉翻起来不太方便,直接附在相关页的下方会不会更好?注释的内容有多有少,放在每一页的下方,会让每一页的正文篇幅有变化, 有些时候还会产生注释在下一页的情况,对于排版是...
- --SoftwareTeacher
- 4. Re:《构建之法》读书笔记
- 先赞文字的流畅和版式的舒服。我是编辑。书中的注释都放在每一章的最后,感觉翻起来不太方便,直接附在相关页的下方会不会更好?本书有较多的超链接,虽然封面提供了整合链接的二维码,但是有的时候读者可能仅仅对某...
- --yeka
- 5. Re:《构建之法》读书笔记
- 不错的总结,C# 代码也不难看懂,多练习一下就好了。 完整的项目贯穿始终,这个想法不错,原来的版本就是有一个电商项目,但是软件工程的很多内容和具体项目/技术没有太多关系, 希望读者在自己的项目里面多问...
- --SoftwareTeacher