2020 年 2月 26 日随笔档案 - 宋岳庭

2020年2月26日

摘要：对话生成：深度强化学习 Deep Reinforcement Learning for Dialogue Generation 强化学习的目的是：构建状态到行为的函数。当前状态、动作、奖励（惩罚）函数阅读全文

posted @ 2020-02-26 21:22 宋岳庭阅读(235) 评论(0) 推荐(0) 编辑