2019 年 5月 24 日随笔档案 - GadflyWZQ

2019年5月24日

摘要：降维降维的动力来自于维度魔咒，动辄几万个甚至更多的特征会导致训练变慢，而且，维数越高越难找到合适的解决方案。特征的维数对应着相同维度的一个高维空间，高维空间中点与点的距离很容易变得很大，也就是实例之间的距离很大，训练集的特征空间很稀疏，这容易导致过拟合，当然，通过添加足够多的训练实例，在理论上可以阅读全文

posted @ 2019-05-24 23:13 GadflyWZQ 阅读(184) 评论(0) 推荐(0) 编辑

机器学习实战-决策树

摘要：决策树决策树是一种强大的算法，可解释性强，对复杂数据集的拟合能力强，对数据集的前期处理（如特征缩放，集中等）要求很少。它的工作原理是，在每个节点上选取一个特征作为分类依据，并给定阈值，根据阈值来将实例归为左子树或右子数，然后对子节点进行同样的特征选取和阈值给定，直至所有节点上的实例都属于同一类别或阅读全文

posted @ 2019-05-24 21:52 GadflyWZQ 阅读(382) 评论(0) 推荐(0) 编辑

GadflyWZQ

公告