2013年5月24日
摘要: 1.LDA算法思想及工作流程,包括讲讲其中细节,如何抽取主题模型2.PLSA算法思想3.贝叶斯分类器如何工作4.为什么贝叶斯计算要定义特征之间是相互独立的5.K-means算法的原理和时间复杂度,这个算法一般要运行多少次才收敛6.基于用户的协同过滤算法如何计算用户相似度,基于item的协同过滤算法如何计算item的相似度7.如何处理大数据量的相似度计算8.给出两个查询词,如何通过搜索引擎得到两个词的相似度,如果搜索引擎的搜索结果不可靠该用什么方法计算,不考虑语义。9.在微博博文里如何计算两篇博文的相关度10.C++中虚函数的实现机制,编译器都做了什么11.C++中inline和define的区 阅读全文
posted @ 2013-05-24 08:45 ahujack 阅读(525) 评论(1) 推荐(0) 编辑
摘要: LDA算法入门一.LDA算法概述:线性判别式分析(LinearDiscriminantAnalysis,LDA),也叫做Fisher线性判别(FisherLinearDiscriminant,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵 阅读全文
posted @ 2013-05-24 08:01 ahujack 阅读(189) 评论(0) 推荐(0) 编辑