摘要: Spark MLlib 的官方例子里面提供的 "数据" 大部分是 libsvm 格式的。这其实是一种非常蛋疼的文件格式,和常见的二维表格形式相去甚远,下图是里面的一个例子: "完整代码" libsvm 文件的基本格式如下: label 为类别标识,index 为特征序号,value 为特征取值。如上 阅读全文
posted @ 2018-12-02 21:15 massquantity 阅读(2408) 评论(0) 推荐(0) 编辑