摘要:
转自http://www.wbrecom.com/?p=342 在预备篇中我们做了一些热身,并且介绍了L1正则化在Online模式下也不能产生较好的稀疏性,而稀疏性对于高维特征向量以及大数据集又特别的重要。因此,从现在开始,我们沿着提升模型稀疏性的主线进行算法介绍。 为了得到稀疏的特征权重 ,最简单 阅读全文
摘要:
一.普通kd-tree 1.在选择划分维度的时候,不能简单的每一个维度轮流划分。还有一种更合适的是利用数据的方差来划分,哪个维度的方差大,就选择哪一个维度划分。理由解释如下: 最简单的方法就是轮着来,即如果这次选择了在第i维上进行数据划分,那下一次就在第j(j≠i)维上进行划分,例如:j = (i 阅读全文