摘要: 一、产生句子 方法:Shannon Visualization Method 过程:根据概率,每次随机选择一个bigram,从而来产生一个句子 比如: 从句子开始标志的bigram开始,我们先有一个(<s>, w),w是随机一个单词,比较有可能的是I这个单词,那么我们就有(<s>, I) 随机选择下 阅读全文
posted @ 2018-08-07 20:16 A_Present 阅读(971) 评论(0) 推荐(0) 编辑
摘要: 一、如何评价语言模型的好坏 标准:比起语法不通的、不太可能出现的句子,是否为“真实”或"比较可能出现的”句子分配更高的概率 过程:先在训练数据集上训练模型的参数,然后在测试数据集上测试模型的效果。 要求:测试数据集与训练数据集完全不同 评价指标:用以评价模型的测试数据集上的效果 二、N-gram 模 阅读全文
posted @ 2018-08-07 19:23 A_Present 阅读(332) 评论(0) 推荐(0) 编辑