数据分析相关问题整理

1.如何理解过拟合？

过拟合和欠拟合一样，都是数据挖掘的基本概念。过拟合指的就是数据训练得太好，在实际的测试环境中可能会产生错误，所以适当的剪枝对数据挖掘算法来说也是很重要的。

欠拟合则是指机器学习得不充分，数据样本太少，不足以让机器形成自我认知。

2.为什么说朴素贝叶斯是“朴素”的？

朴素贝叶斯是一种简单但极为强大的预测建模算法。之所以称为朴素贝叶斯，是因为它假设每个输入变量是独立的。这是一个强硬的假设，实际情况并不一定，但是这项技术对于绝大部分的复杂问题仍然非常有效。

3.SVM最重要的思想是什么？

SVM计算的过程就是帮我们找到超平面的过程，它有个核心的概念叫：分类间隔。SVM的目标就是找出所有分类间隔中最大的那个值对应的超平面。在数学上，这是一个凸优化问题。同样我们根据数据是否线性可分，把SVM分成硬间隔SVM、软间隔SVM和非线性SVM。

4.K-Means和KNN算法的区别是什么？

首先，这两个算法解决的是数据挖掘中的两类问题。K-Means是聚类算法，KNN是分类算法。其次，这两个算法分别是两种不同的学习方式。K-Means是非监督学习，也就是不需要事先给出分类标签，而KNN是有监督学习，需要我们给出训练数据的分类标识。最后，K值的含义不同。K-Means中的K值代表K类。KNN中的K值代表K个最接近的邻居。

节选于原文链接：https://blog.csdn.net/cpongo2/article/details/89017586

posted @ 2020-04-22 20:03 燕麦拿铁阅读(179) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

燕麦拿铁

人生会遇到好的事情，也会遇到不好的事情，这就是人生

数据分析相关问题整理

1.如何理解过拟合？

2.为什么说朴素贝叶斯是“朴素”的？

3.SVM最重要的思想是什么？

4.K-Means和KNN算法的区别是什么？

公告