《白话强化学习与Pytorch》
1.《深度学习原理与Pytorch实战》(第二版)(一)1-5章2.《深度学习原理与Pytorch实战》(第二版)(二)6-10章3.《DEEP LEARNING·深度学习》
4.《白话强化学习与Pytorch》
5.《深度学习原理与Pytorch实战》(第二版)(三)11-15章6.《FPGA的人工智能之路——基于Intel FPGA开发的入门到实践》7.《PyTorch深度学习实战》(一)8.Python学习(五)——配套《PyTorch深度学习实战》9.Python学习(六)——配套《PyTorch深度学习实战》10.Python学习(七)——配套《PyTorch深度学习实战》11.《计算机体系结构与SoC设计》(一)12.《计算机体系结构与SoC设计》(三)13.《生成对抗网络项目实战》(一)14.《生成对抗网络项目实战》(二)第1章 强化学习是什么
监督学习的套路——书P11
主要概念和术语——书P12
超参数是无法通过训练自动学会的参数——书P14
阅读至书P25
——2024.4.28
agent——主体部分
environment——环境
第2章 强化学习的脉络
- 马尔科夫决策过程(Markov Decision Process,MDP)——书P29
更久之前发生的事情不在研究范围之内,只关注前面发生的事件,只针对前面发生的事件和现在发生的事件的关系来做研究 - Model-Based和Model-Free
model是指 在一个环境中各个状态之间转换的概率分布描述
——2024.5.3
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律