摘要: 本课程中所有作业将使用Python来完成。Python本身就是一种很棒的通用编程语言,现在在一些流行的库(numpy,scipy,matplotlib)的帮助下,它为科学计算提供强大的环境。 我们希望课程中的大部分人都有一些Python和numpy的经验;对于其他人来说,本教程将作为Python用于 阅读全文
posted @ 2019-02-11 14:01 深度预习 阅读(438) 评论(0) 推荐(0) 编辑
摘要: 从NLP的最基础开始吧。。不过自己看到这里,还没做总结,这里有一篇很不错的解析,可以分享一下。 N-gram语言模型 考虑一个语音识别系统,假设用户说了这么一句话:“I have a gun”,因为发音的相似,该语音识别系统发现如下几句话都是可能的候选:1、I have a gun. 2、I hav 阅读全文
posted @ 2019-02-11 12:51 深度预习 阅读(417) 评论(1) 推荐(0) 编辑
摘要: 分词(Segment):中英文都存在分词的问题,不过相对来说,英文单词与单词之间本来就有空格进行分割,所以处理起来相对方便。但是中文书写是没有分隔符的,所以分词的问题就比较突出。分词常用的手段可以是基于字典的最长串匹配,据说可以解决85%的问题,但是歧义分词很难。另外就是当下主流的统计机器学习的办法 阅读全文
posted @ 2019-02-11 11:54 深度预习 阅读(620) 评论(0) 推荐(0) 编辑