摘要: 这个题目是Kaggle上一道练习题,网址为https://www.kaggle.com/c/titanic,在官方教程中,提供了R,Python,Excel的解决方法。最近在学习Spark,感觉这个题目可以很好地练习Spark的相关模块,例如SQL,ML等。所以写下了这个博客来记录这个解决方法的流程 阅读全文
posted @ 2016-12-28 16:01 传奇魔法师 阅读(1627) 评论(0) 推荐(0) 编辑
摘要: 矩阵 向量乘法实现 $$x_i=\sum_{j=1}^nm_{ij}v_{j}$$ Map函数 Map函数应用于M的一个元素,但是如果执行Map任务的计算节点还没有将v读到内存,那么首先以一个整体的方式读入v,然后v就可以被该Map任务中执行的Map函数所用。每个Map任务将整个向量v和矩阵M的一个 阅读全文
posted @ 2016-12-28 16:01 传奇魔法师 阅读(2775) 评论(0) 推荐(0) 编辑