BillDingDJ - 博客园

2019年3月5日

Reinforcement Learning学习笔记|Deep Q-learning算法

摘要： An introduction to Deep Q-Learning: let’s play Doom 在上一篇博文，我们学习了Q-learning这种用来产生Q-table的算法。但是我们可以发现，产生和更新Q-table的过程在大的状态空间环境下效率低。在这篇文章中，我们学习Deep Rein 阅读全文

posted @ 2019-03-05 15:53 BillDingDJ 阅读(832) 评论(0) 推荐(0)

Reinforcement Learning学习笔记|Q-learning算法

摘要：在学习增强学习的时候，幸运地找到了国外的一篇入门博文，借来分享，原文很精彩阅读全文

posted @ 2019-03-05 09:24 BillDingDJ 阅读(607) 评论(0) 推荐(0)

2019年3月4日

C++|重拾|笔记20190307

摘要：如果目标不是指针类型，则不需要空值检查对于C++的空间分配操作，记住分两步走：先分空间后赋值 strlen(char *)可以得到字符串的长度（C类型），但是必须要加1，为'\0' 先单元测试，再写程序函数定义部分的实参部分声明不能加默认值 char *nn=new char[10]; dele 阅读全文

posted @ 2019-03-04 21:03 BillDingDJ 阅读(97) 评论(0) 推荐(0)

2019年2月27日

NLP 学习|DAY2|LDA是什么？

摘要： 1. 共轭形式保证了（先验+似然=后验概率）其中后验和先验是同样的形式。对于二项分布来说，其共轭是Beta分布，而对于多项分布来说，其共轭是Dirichlet分布，也是名字Latent Dirichlet allocation的来历。 2.从β分布到Dirichlet分布是从二维到多维的扩展。 3 阅读全文

posted @ 2019-02-27 19:10 BillDingDJ 阅读(418) 评论(0) 推荐(0)

2019年2月25日

NLP 学习|基础学习

摘要： Bag-of-words model: 词袋模型是一种在NLP和IR中的简化的表示形式。在该模型中，文本被表示为成袋的单词，不考虑其语法甚至是单词顺序。词袋模型通常被用在文档分类的方法中，在这些方法中，每个单词的出现频率被用作训练分类器的特征。在实际中，词袋模型主要用作产生特征的工具。这种列表表示阅读全文

posted @ 2019-02-25 19:57 BillDingDJ 阅读(150) 评论(0) 推荐(0)

2018年11月4日

基于Petri网的工作流如何运行

摘要：这样一个Petri网的功能为保证place-under_consideration只有一个token，具体实现过程模拟如下：总结：对于Petri网这类形式化的知识应该紧抓本质，即定义，方得要领。注：摘自《WorkFlow Management》一书，作者Wil van der Aalst and 阅读全文

posted @ 2018-11-04 21:11 BillDingDJ 阅读(672) 评论(0) 推荐(0)

Bill's BLOG

行道水穷处，坐观云起时

公告