摘要: 今天是2015年6月25日,杨师兄迎来了人生中相当重要的一天--博士答辩,给5年精彩的博士生活(一把鼻涕一把泪加各种苦逼)画上了一个圆满的句号。和预答辩一样,杨师兄极其快速地介绍了自己博士论文的研究工作(研究内容太丰富了),让我们这些师弟们在云里和雾里徘徊了40分钟。介绍了自己的研究内容后,杨师兄迎... 阅读全文
posted @ 2015-10-11 18:58 hebin 阅读(965) 评论(0) 推荐(0) 编辑
摘要: 一直听说word2vec在处理词与词的相似度的问题上效果十分好,最近自己也上手跑了跑Google开源的代码(https://code.google.com/p/word2vec/)。1、语料首先准备数据:采用网上博客上推荐的全网新闻数据(SogouCA),大小为2.1G。从ftp上下载数据包Sogo... 阅读全文
posted @ 2014-01-07 15:35 hebin 阅读(29826) 评论(16) 推荐(3) 编辑
摘要: 变量:$w$表示词,$z$表示主题,$\mathbf{w}=(w_1,w_2,\cdots,w_N)$表示文档,语料库$D = (\mathbf{w}_1,\cdots,\mathbf{w}_M)$,$V$表示所有单词的个数(固定值),$N$表示一个文档中的词数(随机变量),$M$是语料库中的文档数... 阅读全文
posted @ 2013-04-25 22:12 hebin 阅读(3627) 评论(0) 推荐(2) 编辑
摘要: 下面用LaTex的公式编写方法编写一个公式:$||\mathbf{x}||_1=\sum_{i}|x_i|$成功了,感谢http://www.cnblogs.com/chaosstar/archive/2012/06/06/2537432.html 阅读全文
posted @ 2013-04-25 21:19 hebin 阅读(189) 评论(0) 推荐(0) 编辑