摘要: https://www.cnblogs.com/wushaogui/p/9146049.html https://blog.csdn.net/kdongyi/article/details/82930913 https://www.cnblogs.com/nxld/p/9741716.html 阅读全文
posted @ 2020-02-24 22:57 少年奶油喵 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 优点:独热编码的值只有0和1,不同的类型存储在垂直的空间,解决了分类器不好处理属性数据的问题,在一定程度上也起到了扩充特征的作用,特征的增加也防止了模型的过拟合。 缺点:当类别的数量很多时,特征空间会变得非常大。在这种情况下,一般可以用主成分分析(PCA)来减少维度。而且one-hot encodi 阅读全文
posted @ 2020-02-24 21:15 少年奶油喵 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 来源:https://blog.csdn.net/weixin_41798592/article/details/101344948 分别处理标签和特征 阅读全文
posted @ 2020-02-24 20:08 少年奶油喵 阅读(1522) 评论(0) 推荐(0) 编辑
摘要: 留坑 方差过滤 通过方差过滤来筛选无用特征 https://blog.csdn.net/fontthrone/article/details/78997449 https://www.cnblogs.com/jasonfreak/p/5448385.html https://www.cnblogs. 阅读全文
posted @ 2020-02-24 18:17 少年奶油喵 阅读(154) 评论(0) 推荐(0) 编辑