day2021_9_24

今日内容

  • 完成了西瓜书第八章、第九章的学习
  • 第八章
    1. 集成学习:将多个个体学习器通过某种策略结合起来,得到一个具有更强泛化能力的学习器。
    2. 集成学习要求个体学习器要有一定的准确性,学习器之间也要有差异
    3. boosting算法:个体学习器之间存在较强的依赖关系,必须串行生成序列化的方法。先从训练集训练出一个基学习器,在先前基学习器做错的训练样本在后续中会收到更多的关注,调整后再根据就样本分布训练出下一个基学习器;反复进行,指导基学习器的数目达到事先指定的值
    4. Bagging算法: 个体学习器之间不存在强依赖关系,可以同时生成并行化方法。对于给定的m个样本,通过自助法得到T个含m个训练样本的采样集,然后基于每个采样集训练出一个基学习器,再将这些学习器进行结合。
  • 第九章
    1. 聚类:在“无监督学习”中,将没有标签的样本划分为若干个不相交的类别。
    2. k均值算法:
      从样本集中随机选择k个样本作为初始均值向量,然后遍历其他样本,其他样本与初始均值近的归为一起,然后重新计算均值,进入到下一轮,直到均值向量没有更新为止。
    3. LVD算法: 与k均值算法类似,随机将几个样本作为初始化向量,然后对其他样本计算他们与向量之间的距离,根据距离长短,更新原型向量的值,直到迭代轮数到一定数目为止。

遇到的问题

  • 第九章后面的高斯混合聚类还是需要多读几次,比较难理解

明日计划

  • 上午完成对第九章的扫尾工作,下午把第十章争取结束了。
posted @ 2021-09-24 22:32  闲伯  阅读(14)  评论(0编辑  收藏  举报