wuyijia

导航

2023年5月10日 #

决策树decision tree

摘要: 1.决策树是一种监督学习方法,既可以处理分类问题,也可以处理回归问题,甚至包括多输出(multioutput)任务. 2.熵泛指某些物质系统状态的一种量度,某些物质系统状态可能出现的程度。在信息论与概率统计中,熵(entropy)是表示随机变量不确定性的变量。熵越大随机变量的不确定性越强,那么从特征 阅读全文

posted @ 2023-05-10 20:51 小吴要努力 阅读(42) 评论(0) 推荐(0) 编辑

机器学习算法-第一篇随记

摘要: 1.无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。 2.机器如一个机械的学生一样,只能通过尝试答对(最小化损失)大量的习题(已知样本)来学习知识(模型参数 ),并期望用学习到的知识(模型参数 ),组成完整的模型 ,回答不知道答案的考试题(未知样本)。 3. 阅读全文

posted @ 2023-05-10 20:47 小吴要努力 阅读(28) 评论(0) 推荐(0) 编辑

knn

摘要: 1.k近邻算法:k值的选择,距离度量,分类决策规则--三个基本要素 2.归一化特征值,消除特征之间量级不同导致的影响,归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。 3.K值的确定: (1)当K的取值过小时,会出现偏差,容易发生过拟合; (2)当K的值取过大时,就相当于用较大邻域中的 阅读全文

posted @ 2023-05-10 20:44 小吴要努力 阅读(92) 评论(0) 推荐(0) 编辑

代码随想录算法训练营第一天|704.二分查找、27.移除元素

摘要: 704-二分查找 讲解链接 【要点】 1.使用二分法的前提:数组要有序,且无重复元素 2.算法复杂度: 时间复杂度:O(log n) 空间复杂度:O(1) 【注意】 1.在二分法后续处理中可能会导致middle的范围超过 int 的数据范围。见如下, 1 int middle = left + (( 阅读全文

posted @ 2023-05-10 18:17 小吴要努力 阅读(27) 评论(0) 推荐(0) 编辑