摘要: 转自http://www.wbrecom.com/?p=342 在预备篇中我们做了一些热身,并且介绍了L1正则化在Online模式下也不能产生较好的稀疏性,而稀疏性对于高维特征向量以及大数据集又特别的重要。因此,从现在开始,我们沿着提升模型稀疏性的主线进行算法介绍。 为了得到稀疏的特征权重 ,最简单 阅读全文
posted @ 2017-04-30 21:51 fisherinbox 阅读(1176) 评论(0) 推荐(0) 编辑
摘要: 一.普通kd-tree 1.在选择划分维度的时候,不能简单的每一个维度轮流划分。还有一种更合适的是利用数据的方差来划分,哪个维度的方差大,就选择哪一个维度划分。理由解释如下: 最简单的方法就是轮着来,即如果这次选择了在第i维上进行数据划分,那下一次就在第j(j≠i)维上进行划分,例如:j = (i 阅读全文
posted @ 2017-04-30 17:55 fisherinbox 阅读(302) 评论(0) 推荐(0) 编辑