机器学习算法优劣势及适用场景总结
持续更新中...
1.k-近邻算法
优势:精度高、对异常值不敏感、无数据输入设定
缺点:计算复杂度高、空间复杂度高
适用数据范围:数值型和标称型
适用场景:
2.ID3决策树算法
优势:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据
劣势:可能会产生过度匹配问题
适用数据类型:标称型
适用场景:
3.朴素贝叶斯
优势:在数据较少的情况下仍然有效,可以处理多类别问题
劣势:对于输入数据的准备方式较为敏感
适用数据类型:标称型数据
适用场景:文档分类、垃圾邮件识别
4.Logistic回归
优势:计算代价不高,易于理解和实现
劣势::容易欠拟合,分类精度可能不高
适用数据类型:数值型和标称型数据
适用场景:
5.支持向量机
优势:泛化错误率低, 计算开销不大, 结果易解释
劣势:对参数调节和核函数选择敏感,原始分类器不加修改仅适用于处理二类问题
适用数据类型:数值型和标称型
我思故我在