机器学习算法优劣势及适用场景总结

持续更新中...

1.k-近邻算法

优势:精度高、对异常值不敏感、无数据输入设定

缺点:计算复杂度高、空间复杂度高

适用数据范围:数值型和标称型

适用场景:

 

2.ID3决策树算法

优势:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据

劣势:可能会产生过度匹配问题

适用数据类型:标称型

适用场景:

 

3.朴素贝叶斯

优势:在数据较少的情况下仍然有效,可以处理多类别问题

劣势:对于输入数据的准备方式较为敏感

适用数据类型:标称型数据

适用场景:文档分类、垃圾邮件识别

 

4.Logistic回归

优势:计算代价不高,易于理解和实现

劣势::容易欠拟合,分类精度可能不高

适用数据类型:数值型和标称型数据

适用场景:

 

5.支持向量机

优势:泛化错误率低, 计算开销不大, 结果易解释

劣势:对参数调节和核函数选择敏感,原始分类器不加修改仅适用于处理二类问题

适用数据类型:数值型和标称型

 

posted @ 2017-12-30 13:01  McConor  阅读(1004)  评论(0)    收藏  举报