会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
2010120422
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2016年2月29日
相似度计算
摘要: 详解见网址 :https://dato.com/products/create/docs/generated/graphlab.recommender.item_similarity_recommender.ItemSimilarityRecommender.html?__hstc=8457130.
阅读全文
posted @ 2016-02-29 21:22 2010120422
阅读(190)
评论(0)
推荐(0)
编辑
特征选取
摘要: 特征选取的方式 文档频率 信息增益(决策树中的信息熵) 户信息量 λ2 测试
阅读全文
posted @ 2016-02-29 21:19 2010120422
阅读(145)
评论(0)
推荐(0)
编辑
LDA(文档主题模型)
摘要: LSA latent semantic analysis 映射词-文档到一个低维隐语义空间 比较词和文档在低纬空间的相似性 topic 是 Vocab 上的概率分布(符合多项式分布) 文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型 plsa 模型 LDA模型 大规模LDA系统 s
阅读全文
posted @ 2016-02-29 17:57 2010120422
阅读(227)
评论(0)
推荐(0)
编辑