掌握Spark机器学习库-02-mllib数据格式

MLlib

1.MLlib介绍

1)MLlib特点

2)哪些算法

3)阅读官方文档

MLlib提供了哪些:

  • 算法
  • 特征工程
  • 管道
  • 持久化

2.MLlib数据格式

1)本地向量

2)标签数据

3)本地矩阵

4)分布式矩阵

5)分布式数据集:RDD,DATASET,DATAFRAME

 

 

 

 

posted on 2018-10-13 17:41  moonlight.ml  阅读(353)  评论(0编辑  收藏  举报

导航