2021 年 7月 31 日随笔档案 - 19376273

2021年7月31日

摘要：强化学习（Reinforcement learning），通俗一点讲，看一理解为教会机器如何利用现有的奖惩规则卷一个高高的分数，通过趋利避害来起到较好的无监督学习效果，缺点也是可以类比得到，机器可能会钻规则的空子，成为一个高分的“卷王”，但是没有学到实际的本领。基本概念强化学习需要先理解几个概念阅读全文

posted @ 2021-07-31 20:04 19376273 阅读(260) 评论(0) 推荐(0) 编辑

李宏毅机器学习课程——Seq2Seq/Attention学习笔记

摘要：这一部分比较有难度，希望结合作业hw8代码，认真整理一下Seq2Seq与Attention机制的内容。本文主要是我对于这部分知识的理解和再加工，如有理解不当之处欢迎大家指出。文中的图文均来自于李老师的PPT。多层LSTM 以下是LSTM的原理$^{[3]}$。一直以来对多层LSTM存在误解，把t 阅读全文

posted @ 2021-07-31 14:49 19376273 阅读(456) 评论(0) 推荐(0) 编辑

Stargazer

公告