随笔 - 65  文章 - 0 评论 - 69 阅读 - 41万
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

09 2016 档案
Spark中决策树源码分析
摘要:1.Example 使用Spark MLlib中决策树分类器API,训练出一个决策树模型,使用Python开发。 """ Decision Tree Classification Example. """ from __future__ import print_function from pysp 阅读全文
posted @ 2016-09-29 17:56 老顽童2007 阅读(2164) 评论(0) 推荐(0) 编辑
常见的相似或相异程度计算方法
摘要:如何衡量数据点之间的相似或相异程度是聚类算法的基础问题,会直接影响聚类分析的效果,最直观的方法是使用距离函数或者相似性函数。 常见的相似或相异程度计算方法。 1.计算公式 1.Minkowski distance 很多距离计算方法都可以归结为基于向量p范数的距离,即Minkowski distanc 阅读全文
posted @ 2016-09-13 21:49 老顽童2007 阅读(1318) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示