学习笔记(9)- 对话生成:深度强化学习

对话生成:深度强化学习
Deep Reinforcement Learning for Dialogue Generation

强化学习的目的是:构建状态到行为的函数

当前状态、动作、奖励(惩罚)函数

posted on 2020-02-26 21:22  宋岳庭  阅读(235)  评论(0编辑  收藏  举报