2014 年 3月 25 日随笔档案 - kobeshow

2014年3月25日

Spark0.9.0机器学习包MLlib-Optimization代码阅读

摘要：基于Spark的一个生态产品--MLlib，实现了经典的机器学算法，源码分8个文件夹，classification文件夹下面包含NB、LR、SVM的实现，clustering文件夹下面包含K均值的实现，linalg文件夹下面包含SVD的实现(稀疏矩阵的表示)，recommendation文件夹下面包含als，矩阵分解实现，regression文件夹下面实现了线性回归，L2的线性回归，L1的线性回归，Util文件夹下面包含了可以为各个算法生成toy-data的文件，另外还有一个DataValidators.scala文件，api文件夹下面是PythonMLLibAPI.scala 文件，最后一个阅读全文

posted @ 2014-03-25 13:55 kobeshow 阅读(1900) 评论(1) 推荐(0)

YYGamer->QQSearcher

机器学习、搜索、数据分析、广告、产品、运营

公告