摘要: 语言模型的自适应 问题: 在训练语言模型时所采用的语料往往来自多种不同的领域,这些综合性语料难以反映不同领域之间在语言使用规律上的差异,而语言模型恰恰对于训练文本的类型、主题和风格等都十分敏感; n 元语言模型的独立性假设的前提是一个文本中的当前词出现的概率只与它前面相邻的 n-1 个词相关,但这种 阅读全文
posted @ 2022-10-20 20:38 eryo 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 基本概念 大规模语料库的出现为自然语言统计处理方法的实现提供了可能,一个句子$s = w_1w_2\cdots w_m$的先验概率如下: $$ \begin{aligned} p(s) &= p(w_1)\times p(w_2|w_1)\times p(w_3|w_1w_2)\times\cdot 阅读全文
posted @ 2022-10-20 18:58 eryo 阅读(93) 评论(0) 推荐(0) 编辑