2024 年 9月 27 日随笔档案 - techlead_krischang

2024年9月27日

摘要：本文详细介绍了强化学习的基础知识和基本算法，包括动态规划、蒙特卡洛方法和时序差分学习，解析了其核心概念、算法步骤及实现细节。关注作者，复旦AI博士，分享AI领域全维度知识与研究。拥有10+年AI领域研究经验、复旦机器人智能实验室成员，国家级大学生赛事评审专家，发表多篇SCI核心期刊学术论文，上亿营阅读全文

posted @ 2024-09-27 10:25 techlead_krischang 阅读(984) 评论(0) 推荐(0) 编辑

公告

昵称： techlead_krischang
园龄： 12年2个月
粉丝： 639
关注： 31

2025年3月

日

一

二

三

四

五

六

techlead_krischang

个人微信公众号：【Python全视角】 TeahLead_KrisChang，10+年的互联网和AI从业经验，10年+技术和业务团队管理经验，同济软件工程本科，复旦工程管理硕士，阿里云认证云服务架构师，上亿营收AI产品业务负责人。

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

合集

随笔档案

阅读排行榜

评论排行榜

推荐排行榜