摘要:
$GBDT$ 也是集成学习 $Boosting$ 家族的成员,但是却和传统的 $Adaboost$ 有很大的不同。回顾下 $Adaboost$,我们是利用前一轮迭代弱学习器的误差率 来更新训练集的权重,这样一轮轮的迭代下去。$GBDT$ 也是迭代,使用了前向分布算法,但是弱学习器限定了只能使用 $C 阅读全文
摘要:
假设有两枚硬币 $A,B$,以相同的概率随机选择一个硬币,进行如下的掷硬币实验:共做 $5$ 次实验,每次实验独立的掷 $5$ 次。 下面左图是在知道每次选择的是硬币 $A$ 还是硬币 $B$ 的情况下的试验结果;右图是在不知道选择的是硬币 $A$ 还是硬币 $B$ 的情况下的试验结果。 问:在这两 阅读全文
摘要:
1. 项集数据和序列数据 首先我们看看项集数据和序列数据有什么不同,如下图所示: 左边的数据集是项集数据,在 Apriori 和 FP Tree 算法中已经看到过,每个项集数据由若干项组成,这些项没有时间上的先后关系。 而右边的序列数据则不一样,它是由若干数据项集组成的序列。比如第一个序列 <a(a 阅读全文
摘要:
先来看一个直角三角形,如下左图: $\sin A$ 的值与三角形的边长有什么联系呢? 从右图可以看出,角 $\alpha$ 的正弦对应单位圆上点的纵坐标,如果不理解可以先去阅读博客。 现在要求角 $A$ 的正弦,应该以点 $A$ 为圆心做单位圆,以边 $AC$ 为 $x$ 轴,那么有 $$\sin 阅读全文