01 2017 档案
摘要:KNN(K-Nearest Neighbor)介绍 Wikipedia上的 KNN词条 中有一个比较经典的图如下: KNN的算法过程是是这样的: 从上图中我们可以看到,图中的数据集是良好的数据,即都打好了label,一类是蓝色的正方形,一类是红色的三角形,那个绿色的圆形是我们待分类的数据。 如果K=
阅读全文
摘要:转:© 著作权归作者所有 by ido 什么是KNN算法呢?顾名思义,就是K-Nearest neighbors Algorithms的简称。我们可能都知道最近邻算法,它就是KNN算法在k=1时的特例,也就是寻找最近的邻居。我们从名字可以知道我们要寻找邻居,但是为什么要寻找邻居,如何选取邻居,选取多
阅读全文
摘要:App特质的作用 运行结果: 问题: 是怎么把封装的初始化代码块传给delayedInit(body: => Unit)的? 用反编译工具jd-gui.exe把上面生成的.class反编译出来,可以看到多出了好多个类, 其中主要的有 class AppInternals, delayedInitbo
阅读全文
摘要:掌握implicit的用法是阅读Spark源码的基础,也是学习Scala其它的开源框架的关键,implicit 可分为: 隐式参数 隐式转换类型 隐式调用函数 1.隐式参数 当我们在定义方法时,可以把最后一个参数列表标记为implicit,表示该组参数是隐式参数。一个方法只会有一个隐式参数列表,置于
阅读全文
摘要:1、 打开 Myeclipse 工具栏下的Help下的Install from Site 2、打开后弹出窗口, 并点击Add标签,如下图: 3、现在是最重要的一步,填写相关信息。 在对话框Name输入svn, URL中输入:http://subclipse.tigris.org/update_1.6
阅读全文
摘要:正态分布是如何被高斯推导出来的, 我感觉高斯更像是猜出了正态分布。 详见这篇文章:《正态分布的前世今生》 http://songshuhui.NET/archives/76501 说一说理解高斯推导过程中的难点: 1. log函数的出现:log函数的出现能把连乘化为求和方便计算,而且log是一对一的
阅读全文
摘要:一、正态分布,熟悉的陌生人 学过基础统计学的同学大都对正态分布非常熟悉。这个钟型的分布曲线不但形状优雅,其密度函数写成数学表达式 也非常具有数学的美感。其标准化后的概率密度函数 更加的简洁漂亮,两个最重要的数学常量π,e都出现在了公式之中。在我个人的审美之中,它也属于top-N的最美丽的数学公式之一
阅读全文
摘要:运算符优先级决定术语的表达式分组。这会影响一个表达式是如何进行计算。某些运算符的优先级高于其他;例如,乘法运算符的优先级比所述加法运算符优先级更高: 例如X =7 + 3* 2;这里,x 被赋值13,而不是20,因为运算符* 优先级高于+,所以它首先做乘法3 * 2,然后加上7。 这里,具有最高优先
阅读全文
摘要:Scala类 1 2 3 4 5 6 7 8 9 10 11 12 13 class Counter { private var value = 0 // 必须初始化字段 def increment() { value += 1 } // 方法默认公有 def current = value //
阅读全文
摘要:突然看到这样一个神片, 用建模方式进行分析, 绝了,故转之.... 引言: 上周我的一个朋友第N 次向女生表白遭到拒绝,作为好朋友的我除了同情之外觉得应该做点什么。之前一次聊天受到 菠菜 的启发,加上出于对数学的兴趣,我对女生“选择与拒绝”的策略试着做了一个简单的建模,并得出比较有意义的结论。 摘要
阅读全文
摘要:图1 spark 相关 亚马逊云存储之S3(Simple Storage Service简单存储服务) (转 ) S3是Simple Storage Service的缩写,即简单存储服务。亚马逊的名词缩写也都遵循这个习惯,例如Elastic Compute Cloud缩写为EC2等等。其他组织类似的
阅读全文
摘要:类别 名称 官网 备注 查询引擎 Phoenix https://phoenix.apache.org/ Salesforce公司出品,Apache HBase之上的一个SQL中间层,完全使用Java编写 Kylin http://kylin.io eBay开源的基于Hadoop的分布式OLAP分析
阅读全文