2020年2月26日
摘要: 对话生成:深度强化学习 Deep Reinforcement Learning for Dialogue Generation 强化学习的目的是:构建状态到行为的 函数 。 当前状态、动作、奖励(惩罚)函数 阅读全文
posted @ 2020-02-26 21:22 宋岳庭 阅读(235) 评论(0) 推荐(0) 编辑