用于分类的最佳监督机器学习

The picture is from https://www.montessoriservices.com/vertebrate-invertebrate-classification-cards-1965.

分类是一种基于数据对事物进行分类的方法。分组方法可以自动使用机器学习。可以处理分类问题的专业技术包括监督机器学习。

监督机器学习有很多种。选择合适的是一个问题。许多科学家觉得很难选择它，因为有时只是通过一些机器学习来处理这个问题。这就是为什么科学家必须根据需要分析技术。

以下是与业务相关的各种监督机器学习的主要优点和缺点。

逻辑回归

优势：

特征具有影响数据概率的正向或负向的唯一方法。

坏处：

总是必须处理多重共线性，这意味着值必须是恒定的。

支持向量机 (SVM)

优势：

有效处理高维数据。

坏处：

总是必须处理多重共线性，这意味着值必须是恒定的。

K-最近邻 (KNN)

优势：

处理任何情况的最佳方法。

坏处：

无法处理到目前为止的异常值。

朴素贝叶斯

优势：

易于解释

坏处：

不是来自训练集的新值将返回为 0。

决策树

优势：

甚至可以处理远离训练集的所有新数据。

坏处：

性能低于集成方法。

集成方法是模型的组合以获得更高的性能。有两种集成方法。第一种方法是结合多种监督机器学习。除了决策树之外，该方法还可以使用一种监督机器学习来协同工作。这是因为决策树模型是监督机器学习的最佳方法。这就是为什么将许多决策树模型组合成一个模型是第二种集成方法的原因。第二种方法是包括随机森林和增强方法，例如 xgboost。

以下是与业务相关的各种决策树集成学习的主要优点和缺点。

优势：

获取所有优势并减少劣势决策树。

坏处：

倾向于比其他非集成方法更慢的过程。

本文链接：https://www.qanswer.top/14356/24070501

posted @ 2022-09-05 01:24 哈哈哈来了啊啊啊阅读(57) 评论(0) 收藏举报

刷新页面返回顶部

amboke

用于分类的最佳监督机器学习

用于分类的最佳监督机器学习

公告