摘要: An introduction to Deep Q-Learning: let’s play Doom 在上一篇博文,我们学习了Q-learning这种用来产生Q-table的算法。但是我们可以发现,产生和更新Q-table的过程在大的状态空间环境下效率低。 在这篇文章中,我们学习Deep Rein 阅读全文
posted @ 2019-03-05 15:53 BillDingDJ 阅读(764) 评论(0) 推荐(0) 编辑
摘要: 在学习增强学习的时候,幸运地找到了国外的一篇入门博文,借来分享,原文很精彩 阅读全文
posted @ 2019-03-05 09:24 BillDingDJ 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 如果目标不是指针类型,则不需要空值检查 对于C++的空间分配操作,记住分两步走:先分空间后赋值 strlen(char *)可以得到字符串的长度(C类型),但是必须要加1,为'\0' 先单元测试,再写程序 函数定义部分的实参部分声明不能加默认值 char *nn=new char[10]; dele 阅读全文
posted @ 2019-03-04 21:03 BillDingDJ 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 1. 共轭形式保证了(先验+似然=后验概率)其中后验和先验是同样的形式。 对于二项分布来说,其共轭是Beta分布,而对于多项分布来说,其共轭是Dirichlet分布,也是名字Latent Dirichlet allocation的来历。 2.从β分布到Dirichlet分布是从二维到多维的扩展。 3 阅读全文
posted @ 2019-02-27 19:10 BillDingDJ 阅读(385) 评论(0) 推荐(0) 编辑
摘要: Bag-of-words model: 词袋模型是一种在NLP和IR中的简化的表示形式。在该模型中,文本被表示为成袋的单词,不考虑其语法甚至是单词顺序。词袋模型通常被用在文档分类的方法中,在这些方法中,每个单词的出现频率被用作训练分类器的特征。 在实际中,词袋模型主要用作产生特征的工具。这种列表表示 阅读全文
posted @ 2019-02-25 19:57 BillDingDJ 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 这样一个Petri网的功能为保证place-under_consideration只有一个token,具体实现过程模拟如下: 总结:对于Petri网这类形式化的知识应该紧抓本质,即定义,方得要领。 注:摘自《WorkFlow Management》一书,作者Wil van der Aalst and 阅读全文
posted @ 2018-11-04 21:11 BillDingDJ 阅读(625) 评论(0) 推荐(0) 编辑