邮箱图标 wotula.com
摘要: 简介 过去几年,深度神经网络在模式识别中占绝对主流。它们在许多计算机视觉任务中完爆之前的顶尖算法。在语音识别上也有这个趋势了。 虽然结果好,我们也必须思考……它们为什么这么好使? 在这篇文章里,我综述一下在自然语言处理(NLP)上应用深度神经网络得到的一些效果极其显著的成果。我希望能提供一个能解释为 阅读全文
posted @ 2016-03-01 11:07 编程浪子Yiutto 阅读(1140) 评论(0) 推荐(0) 编辑
摘要: 前言在这个物欲横流的社会中,任何物品都是明码实价的,甚至许多虚拟的物品(爱情、亲情)都可能用金钱来衡量。对于计算器科学而言,我们也希望能对信息做一个量化的衡量。比如,这篇博客包含多少信息量。可能有的人会说这个问题很简单啊,我们可以通过字数来衡量,但是仔细想想,这是占不住脚的。例如,提到“苹果”,很多... 阅读全文
posted @ 2016-01-19 20:36 编程浪子Yiutto 阅读(885) 评论(1) 推荐(0) 编辑
摘要: 【我们是这样理解语言的-上】神经网络语言模型http://www.cnblogs.com/Yiutto/articles/5082472.html 阅读全文
posted @ 2015-12-28 15:29 编程浪子Yiutto 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 【我们是这样理解语言的-下】神经网络语言模型http://www.cnblogs.com/Yiutto/articles/5082704.html 阅读全文
posted @ 2015-12-28 14:34 编程浪子Yiutto 阅读(241) 评论(0) 推荐(0) 编辑
摘要: N-Gram模型时大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM, Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息,在需要把连续无空格的拼音、笔画,或代表字母或笔画的数字,转换成汉字串(即句子)时,可以计算出最大概率的句... 阅读全文
posted @ 2015-12-25 11:11 编程浪子Yiutto 阅读(218) 评论(0) 推荐(0) 编辑
摘要: 0. 词向量是什么 自然语言理解的问题要转化为机器学习的问题,第一步肯定是要找一种方法把这些符号数学化。 NLP 中最直观,也是到目前为止最常用的词表示方法是 One-hot Representation,这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为 0,只... 阅读全文
posted @ 2015-12-24 10:29 编程浪子Yiutto 阅读(981) 评论(0) 推荐(0) 编辑
摘要: 今天小S 决定咬着牙写写 NIPS 2015 的论文总结。NIPS 文章理论较多,耗时耗力,如果有总结不周的地方,大家多多包涵,多多指正。因为 NIPS 文章也很多,我将会按照官方的 topic 分类。今天先分享 Deep Learning Symposium 中一些 references。依然很多... 阅读全文
posted @ 2015-12-15 14:38 编程浪子Yiutto 阅读(1749) 评论(0) 推荐(0) 编辑
摘要: Feature extraction和feature selection 都同属于Dimension reduction。要想搞清楚问题当中二者的区别,就首先得知道Dimension reduction是包含了feature selection这种内在联系,再在这种框架下去理解各种算法和方法之间的区... 阅读全文
posted @ 2015-12-07 13:53 编程浪子Yiutto 阅读(27669) 评论(1) 推荐(4) 编辑
摘要: Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱2015-01-3152nlpNLPJob曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后... 阅读全文
posted @ 2015-12-01 20:45 编程浪子Yiutto 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 2015年EMNLP自然语言处理实证方法会议(Conferenceon Empirical Methods in Natural Language Processing)于2015年9月17-22日在葡萄牙里斯本市召开。EMNLP是自然语言处理领域的顶级会议,由ACL学会下属特殊兴趣小组SIGDAT... 阅读全文
posted @ 2015-12-01 19:56 编程浪子Yiutto 阅读(1285) 评论(0) 推荐(0) 编辑