学习笔记（9）- 对话生成：深度强化学习

对话生成：深度强化学习
Deep Reinforcement Learning for Dialogue Generation

强化学习的目的是：构建状态到行为的函数。

当前状态、动作、奖励（惩罚）函数

posted on 2020-02-26 21:22 宋岳庭阅读(235) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部