Apache Mahout 0.2发布了,Mahout是Apache Lucene的一个子项目,基于Hadoop实现各种机器学习与数据挖掘算法库,Mahout 0.2主要亮点有:
协作过滤引擎的性能提升与和API的更新
K近邻与SVD推荐算法实现
基于并行FP增长算法的随机森林(Random Forest)和频繁模式挖掘
LDA(Latent Dirichilet Allocation)实现
基于hadoop 0.20.x的更新
最新相关内容:
Google Image Swirl
Yahoo Quest:基于Yahoo问答(Answers)内容的自然语言处理研究
Google社会化搜索(Social search)进入实验阶段
Matt Cutts:Caffeine将在明年初全部上线
将本文收藏到: 365Key