11 2018 档案

摘要:一、最大似然估计与最大后验概率 1、概率与统计 概率与统计是两个不同的概念。 概率是指:模型参数已知,X未知,p(x1) ... p(xn) 都是对应的xi的概率 统计是指:模型参数未知,X已知,根据观测的现象,求模型的参数 2、似然函数与概率函数 似然跟概率是同义词,所以似然也是表示概率,但这个概 阅读全文
posted @ 2018-11-25 19:33 zhaop 阅读(2302) 评论(0) 推荐(0) 编辑
摘要:一、关于分词 原则: 颗粒度越大越好:用于进行语义分析的文本分词,要求分词结果的颗粒度越大,即单词的字数越多,所能表示的含义越确切,如:“公安局长”可以分为“公安 局长”、“公安局 长”、“公安局长”都算对,但是要用于语义分析,则“公安局长”的分词结果最好 切分结果中非词典词越少越好,单字字典词数越 阅读全文
posted @ 2018-11-19 15:42 zhaop 阅读(1467) 评论(0) 推荐(0) 编辑
摘要:语言模型 语言模型 就是估测一些词的序列的概率,即预测 p(w1, w2, w3 ... wn), 一个应用就是句子的生成。 2. 语言模型的种类 Ngram ngram是一种统计的方法,它相当于固定了一个窗口,在这个窗口内的词是相关的,也就是第n个词和前n个词相关:P(s) = p(w1) p(w 阅读全文
posted @ 2018-11-01 11:45 zhaop 阅读(805) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示