09 2022 档案

摘要:SVM支持向量机 简述: 给定一个特征空间上的数据集: T= { (x1,y1),(x2,y2),...(xN,yN) } 其中,xiRn,yi {+1,1 } 阅读全文
posted @ 2022-09-07 11:25 guangheli 阅读(43) 评论(0) 推荐(0) 编辑
摘要:K 近邻算法 K 近邻算法的思想非常简单:对于测试数据,在训练数据中找到 K 个与之距离最近的点并进行多数表决。 K 取值比较小时会只考虑与输入实例距离非常近的点,但是噪声对结果的影响会很大。 K 取值较大时会考虑与输入实例距离较大的点,虽然可以避免噪声的影响,但是由于距离过大还是会 阅读全文
posted @ 2022-09-07 10:10 guangheli 阅读(20) 评论(0) 推荐(0) 编辑
摘要:集成学习 在机器学习中,只使用一个模型容易出现过拟合现象,并且发挥不出数据量大的优势。 集成学习的思路是将一堆效果一般的模型通过某种方式组合在一起,形成一个更有效的大模型。 具体地,设训练集为 D,特征集为 A,每次选择 DA 的子集 D,A 作为训练数据训练若干个小 阅读全文
posted @ 2022-09-05 14:15 guangheli 阅读(33) 评论(0) 推荐(0) 编辑
摘要:熵 H=i=1np(xi)logp(xi) n 是分类的数目,熵越大代表随机变量 X 的不确定性越大。 可知 0H(P)logn 条件熵 H(Y|X) 表示已知随机变量 X 的条 阅读全文
posted @ 2022-09-04 22:41 guangheli 阅读(63) 评论(0) 推荐(0) 编辑
摘要:参考:《统计学习方法》 相似度与距离 对于聚类算法来说,定义相似度与距离是十分关键的。 Minkowski distance 设 xi,xj 是样本集合 X 中的样本,m 为特征数量,满足 xi=(x1i,x2i,....xmi)T 则 $x_{ 阅读全文
posted @ 2022-09-04 19:45 guangheli 阅读(140) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示