摘要: 参考'LogisticRegression in MLLib' (http://www.cnblogs.com/luweiseu/p/7809521.html) 通过pySpark MLlib训练logistic模型,再利用Matplotlib作图画出分类边界。 最终结果: 阅读全文
posted @ 2017-11-13 15:50 wlu 阅读(1702) 评论(0) 推荐(1) 编辑
摘要: SVD分解: $A=U\Sigma V^T$,变换:$\hat{A}=A\cdot V=U\Sigma$ 分解时先计算$A^TA=U\Sigma^2U^T$,再进行SVD分解 SVD分解: 调用Breeze的SVD库,得到$U,\Sigma$ Explained Variance Ratio exp 阅读全文
posted @ 2017-11-13 12:58 wlu 阅读(359) 评论(0) 推荐(0) 编辑
摘要: Voting classifier 多种分类器分别训练,然后分别对输入(新数据)预测/分类,各个分类器的结果视为投票,投出最终结果: 训练: 投票: 为什么三个臭皮匠顶一个诸葛亮。通过大数定律直观地解释: 一个硬币P(H)=0.51。大数定律保证抛硬币很多次之后,平均得到的正面频数接近$0.51 \ 阅读全文
posted @ 2017-11-13 09:05 wlu 阅读(1770) 评论(0) 推荐(0) 编辑