用于分类的最佳监督机器学习
用于分类的最佳监督机器学习
The picture is from https://www.montessoriservices.com/vertebrate-invertebrate-classification-cards-1965.
分类是一种基于数据对事物进行分类的方法。分组方法可以自动使用机器学习。可以处理分类问题的专业技术包括监督机器学习。
监督机器学习有很多种。选择合适的是一个问题。许多科学家觉得很难选择它,因为有时只是通过一些机器学习来处理这个问题。这就是为什么科学家必须根据需要分析技术。
以下是与业务相关的各种监督机器学习的主要优点和缺点。
- 逻辑回归
优势 :
特征具有影响数据概率的正向或负向的唯一方法。
坏处:
总是必须处理多重共线性,这意味着值必须是恒定的。
- 支持向量机 (SVM)
优势:
有效处理高维数据。
坏处:
总是必须处理多重共线性,这意味着值必须是恒定的。
- K-最近邻 (KNN)
优势:
处理任何情况的最佳方法。
坏处:
无法处理到目前为止的异常值。
- 朴素贝叶斯
优势:
易于解释
坏处:
不是来自训练集的新值将返回为 0。
- 决策树
优势:
甚至可以处理远离训练集的所有新数据。
坏处:
性能低于集成方法。
集成方法是模型的组合以获得更高的性能。有两种集成方法。第一种方法是结合多种监督机器学习。除了决策树之外,该方法还可以使用一种监督机器学习来协同工作。这是因为决策树模型是监督机器学习的最佳方法。这就是为什么将许多决策树模型组合成一个模型是第二种集成方法的原因。第二种方法是包括随机森林和增强方法,例如 xgboost。
以下是与业务相关的各种决策树集成学习的主要优点和缺点。
优势:
获取所有优势并减少劣势决策树。
坏处:
倾向于比其他非集成方法更慢的过程。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通