会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
超大的皮卡丘
用你的激情与热情,感染更多的人,影响更多的人。
博客园
首页
新随笔
联系
订阅
管理
2015年12月6日
Spark MLlib知识点学习整理
摘要: MLlib的设计原理:把数据以RDD的形式表示,然后在分布式数据集上调用各种算法。MLlib就是RDD上一系列可供调用的函数的集合。操作步骤:1、用字符串RDD来表示信息。2、运行MLlib中的一个特征提取算法来吧文本数据转换为数值的特征。给操作会返回一个向量RDD。3、对向量RDD调用分类算法,返...
阅读全文
posted @ 2015-12-06 22:02 松伯
阅读(2236)
评论(0)
推荐(0)
编辑