yangyang12138

导航

2020年2月26日 #

主题模型

摘要: 1.概述 一篇文章的每个词都是以一定的概率选择了某个主题,并从这个主题中以一定的概率选择某个词而组成的。 P(单词|文档) = P(单词|主题)*P(主题|文档) 生成过程 对于语料中每篇文档,主题模型定义如下生成过程: (1).对每一篇文档,从主题分布中抽取一个主题; (2).从上述被抽到的主题所 阅读全文

posted @ 2020-02-26 20:41 杨杨09265 阅读(149) 评论(0) 推荐(0) 编辑

强化学习

摘要: 1.概述 强化学习可以理解为逐渐得到最好结果的一个过程,类似与半监督学习,整个过程是在不断的逼近结果。强化学习是状态与动作直接的映射。目标是最大化奖赏的数值。 一个简单的例子是迷宫问题,动作就是选择下一步去哪儿,状态就是离重点的距离,如果这个点不能达到距离这个值就是-1 2.奖赏的折扣 对于未来的奖 阅读全文

posted @ 2020-02-26 03:35 杨杨09265 阅读(151) 评论(0) 推荐(0) 编辑