2015年12月6日
摘要: MLlib的设计原理:把数据以RDD的形式表示,然后在分布式数据集上调用各种算法。MLlib就是RDD上一系列可供调用的函数的集合。操作步骤:1、用字符串RDD来表示信息。2、运行MLlib中的一个特征提取算法来吧文本数据转换为数值的特征。给操作会返回一个向量RDD。3、对向量RDD调用分类算法,返... 阅读全文
posted @ 2015-12-06 22:02 松伯 阅读(2236) 评论(0) 推荐(0) 编辑