2020 年 2月 26 日随笔档案 - 杨杨09265

2020年2月26日 #

主题模型

摘要： 1.概述一篇文章的每个词都是以一定的概率选择了某个主题，并从这个主题中以一定的概率选择某个词而组成的。 P(单词|文档) = P(单词|主题)*P(主题|文档) 生成过程对于语料中每篇文档，主题模型定义如下生成过程: (1).对每一篇文档,从主题分布中抽取一个主题; (2).从上述被抽到的主题所阅读全文

posted @ 2020-02-26 20:41 杨杨09265 阅读(149) 评论(0) 推荐(0) 编辑

强化学习

摘要： 1.概述强化学习可以理解为逐渐得到最好结果的一个过程，类似与半监督学习，整个过程是在不断的逼近结果。强化学习是状态与动作直接的映射。目标是最大化奖赏的数值。一个简单的例子是迷宫问题,动作就是选择下一步去哪儿，状态就是离重点的距离，如果这个点不能达到距离这个值就是-1 2.奖赏的折扣对于未来的奖阅读全文

posted @ 2020-02-26 03:35 杨杨09265 阅读(151) 评论(0) 推荐(0) 编辑

yangyang12138

导航

公告

主题模型

强化学习