三.分类算法

sklearn转换器和预估器，k-相邻算法，模型选择和调优，贝叶斯算法，决策树，随机森林，

摘要：因为决策树会出现那种过拟合的情况，这时候我们就会用到随机森林 # 1 什么是集成学习方法 >集成学习通过建立几个模型组合的来解决单一预测问题。它的工作原理是生成多个分类器/模型，各自独立地学习和作出预测。这些预测最后结合成组合预测，因此优于任何一个单分类的做出预测。 **说白了，就是三个臭皮匠顶一个阅读全文

posted @ 2023-06-11 00:10 lipu123 阅读(111) 评论(0) 推荐(0) 编辑

3.5决策树算法

摘要：# 1.认识决策树 >**决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-then结构，最早的决策树就是利用这类结构分割数据的一种分类学习方法怎么理解这句话？通过一个对话例子** ![image](https://img2023.cnblogs.com/blog/1914163/202 阅读全文

posted @ 2023-06-10 20:28 lipu123 阅读(74) 评论(0) 推荐(0) 编辑

3.4 朴素贝叶斯算法

摘要：# 1 什么是朴素贝叶斯算法 ![image](https://img2023.cnblogs.com/blog/1914163/202306/1914163-20230610173416866-384467657.png) ![image](https://img2023.cnblogs.com/ 阅读全文

posted @ 2023-06-10 19:14 lipu123 阅读(33) 评论(0) 推荐(0) 编辑

3.3 模型选择和调优(KNN)

摘要：# 1.什么是交叉验证(cross validation) 交叉验证：将拿到的训练数据，分为训练和验证集。以下图为例：将数据分成5份，其中一份作为验证集。然后经过5次(组)的测试，每次都更换不同的验证集。即得到5组模型的结果，取平均值作为最终结果。又称5折交叉验证。我们之前知道数据分为训练集和测试阅读全文

posted @ 2023-06-10 17:02 lipu123 阅读(136) 评论(0) 推荐(0) 编辑

fit、transform、fit_transform的区别和联系

摘要：# 1.来源 **fit和transform没有任何关系，仅仅是数据处理的两个不同环节，之所以出来fit_transform这个函数名，仅仅是为了写代码方便，会高效一点。 sklearn里的封装好的各种算法使用前都要fit，fit相对于整个代码而言，为后续API服务。fit之后，然后调用各种API方阅读全文

posted @ 2023-06-10 16:01 lipu123 阅读(241) 评论(0) 推荐(1) 编辑

3.2 KNN算法(k-近邻算法)

摘要：# 1.什么是k-近邻算法例如： ![image](https://img2023.cnblogs.com/blog/1914163/202306/1914163-20230610140106397-386071160.png) >**如果你不知道你现在在哪，你可以通过你和你的邻居的距离推算出你的阅读全文

posted @ 2023-06-10 15:25 lipu123 阅读(34) 评论(0) 推荐(0) 编辑

3.1分类算法之sklean转换器和预估器

摘要：# 1.转换器 **想一下之前做的特征工程的步骤？ 1、实例化 (实例化的是一个转换器类(Transformer)) 2、调用fit_transform(对于文档建立分类词频矩阵，不能同时调用) ** ``` 标准化: (x-mean)/std fit_transform() fit() 计算每一列阅读全文

posted @ 2023-06-10 13:55 lipu123 阅读(24) 评论(0) 推荐(0) 编辑

公告

昵称： lipu123
园龄： 5年2个月
粉丝： 9
关注： 3

+加关注

2025年3月

日

一

二

三

四

五

六

lipu123

随笔分类 - 深度学习&机器学习&机器学习 / 机器学习 / 三.分类算法

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论