摘要:
理论:参考链接 Beta分布是二项式分布的共轭先验分布,而狄利克雷(Dirichlet)分布是多项式分布的共轭分布。 共轭的意思是,以Beta分布和二项式分布为例,数据符合二项分布的时候,参数的先验分布和后验分布都能保持Beta分布的形式,这种形式不变的好处是,我们能够在先验分布中赋予参数很明确的物 阅读全文
摘要:
一、句法分析 参考链接1,参考链接2 将顺序输入的句子输出成树形符合句子结构的非线性数据结构。 CFG 现在一般都是用seq2seq模型来做的。 PCFG,在每个语法后面标注使用这个语法的概率: 使用PCFG计算每棵树的score,用来选择最好的那棵树。 如果枚举所有的树去找概率,计算量太大,指数级 阅读全文
摘要:
一、Word2Vec: 参考学习链接 1.需要具备的基础知识: - 哈夫曼树、哈夫曼编码(变长编码,高频距离root近) - 【统计语言模型】N-gram模型(这里模型表示的下标和上标表示起始和终止,表示第k个单词被假设只和其前n-1个单词相关,也就是【k-(n-1)一直到k-1】) 传统的方法需要 阅读全文