摘要:
给定样本示例x=(x1,x2,x3....xd),线性模型的目标是学得一个线性函数,即属性的线性组合 f(x)=w1x1+w2x2+...+wdxd+b。所以训练线性模型的目标就是求w、b.得到线性模型后就可以预测新的样本。 一、线性回归 给定数据集D={(x1,y1),(x2,y2)...(xm, 阅读全文
摘要:
对于LDA模型,最常用的两个评价方法困惑度(Perplexity)、相似度(Corre)。 其中困惑度可以理解为对于一篇文章d,所训练出来的模型对文档d属于哪个主题有多不确定,这个不确定成都就是困惑度。困惑度越低,说明聚类的效果越好。 计算公式 分母是测试集中所有单词之和,即测试集的总长度,不用排重 阅读全文