会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
hebin
博客园
首页
新随笔
联系
订阅
管理
2015年10月11日
杨锦锋师兄博士毕业答辩
摘要: 今天是2015年6月25日,杨师兄迎来了人生中相当重要的一天--博士答辩,给5年精彩的博士生活(一把鼻涕一把泪加各种苦逼)画上了一个圆满的句号。和预答辩一样,杨师兄极其快速地介绍了自己博士论文的研究工作(研究内容太丰富了),让我们这些师弟们在云里和雾里徘徊了40分钟。介绍了自己的研究内容后,杨师兄迎...
阅读全文
posted @ 2015-10-11 18:58 hebin
阅读(1000)
评论(0)
推荐(0)
2014年1月7日
利用中文数据跑Google开源项目word2vec
摘要: 一直听说word2vec在处理词与词的相似度的问题上效果十分好,最近自己也上手跑了跑Google开源的代码(https://code.google.com/p/word2vec/)。1、语料首先准备数据:采用网上博客上推荐的全网新闻数据(SogouCA),大小为2.1G。从ftp上下载数据包Sogo...
阅读全文
posted @ 2014-01-07 15:35 hebin
阅读(29860)
评论(16)
推荐(3)
2013年4月25日
Latent Dirichlet Allocation(LDA)
摘要: 变量:$w$表示词,$z$表示主题,$\mathbf{w}=(w_1,w_2,\cdots,w_N)$表示文档,语料库$D = (\mathbf{w}_1,\cdots,\mathbf{w}_M)$,$V$表示所有单词的个数(固定值),$N$表示一个文档中的词数(随机变量),$M$是语料库中的文档数...
阅读全文
posted @ 2013-04-25 22:12 hebin
阅读(3646)
评论(0)
推荐(2)
博客里编公式
摘要: 下面用LaTex的公式编写方法编写一个公式:$||\mathbf{x}||_1=\sum_{i}|x_i|$成功了,感谢http://www.cnblogs.com/chaosstar/archive/2012/06/06/2537432.html
阅读全文
posted @ 2013-04-25 21:19 hebin
阅读(193)
评论(0)
推荐(0)
公告