随笔分类 - 强化学习
摘要:一、推荐中如何定义强化学习的几个元素 方式1: Agent:推荐引擎。 Environment:用户。 Reward:如果一条新闻被点击,计+1,否则为0。一次推荐中10条新闻被点击的新闻个数作为Reward。 State:包含3个部分,分别是用户标签、候选新闻的新闻标签和用户前4屏的点击历史(如果
阅读全文
摘要:来源:https://www.zhihu.com/question/26408259 问题分析 我们可以通过强化学习(reinforcement learning)来解决小鸟怎么飞这个问题。强化学习中有状态(state)、动作(action)、奖赏(reward)这三个要素。智能体(Agent,指小
阅读全文
摘要:代码实现参考GitHub:https://github.com/gczr/Q-Learning
阅读全文