上一页 1 2 3 4 5 6 7 8 9 10 ··· 21 下一页
摘要: XGBoost是GBDT的改进和重要实现,主要在于: 提升算法 XGBoost也是一个加法模型,首先其在目标函数中加入了正则化项: 泰勒级数 yi(t)是第i个实例在第t次迭代的预测值,需要加入 ft来最小化以下目标 通过泰勒二阶展开近似来快速优化目标函数 其中 即l的一阶和二阶导数。移除常数项得到 阅读全文
posted @ 2018-09-25 11:33 FlyingWarrior 阅读(2346) 评论(0) 推荐(0) 编辑
摘要: 题目描述 给定一个大小为 n 的数组,找出其中所有出现超过 ⌊ n/3 ⌋ 次的元素。 说明: 要求算法的时间复杂度为 O(n),空间复杂度为 O(1)。 示例 1: 示例 2: 解题思路 由于数组中出现次数超过 $\frac{1}{3}$ 的数字最多只可能为两个,所以记录两个数字n1、n2,以及他 阅读全文
posted @ 2018-09-21 16:14 FlyingWarrior 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 提升树的学习优化过程中,损失函数平方损失和指数损失时候,每一步优化相对简单,但对于一般损失函数优化的问题,Freidman提出了Gradient Boosting算法,其利用了损失函数的负梯度在当前模型的值: 作为回归问题提升树算法的残差近似值,去拟合一个回归树。 函数空间的数值优化 优化目标是使得 阅读全文
posted @ 2018-09-21 15:00 FlyingWarrior 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 什么是类不平衡问题 类不平衡(class-imbalance)是指在训练分类器中所使用的训练集的类别分布不均。比如说一个二分类问题,1000个训练样本,比较理想的情况是正类、负类样本的数量相差不多;而如果正类样本有995个、负类样本仅5个,就意味着存在类不平衡。 在后文中,把样本数量过少的类别称为“ 阅读全文
posted @ 2018-09-19 18:36 FlyingWarrior 阅读(2460) 评论(0) 推荐(0) 编辑
摘要: 题目描述 给定一个只包括 '(',')','{','}','[',']' 的字符串,判断字符串是否有效。 有效字符串需满足: 注意空字符串可被认为是有效字符串。 示例 1: 示例 2: 示例 3: 示例 4: 示例 5: 解题思路 利用栈的思想,对于左括号直接入栈,对于右括号,判断栈顶元素是否为对应 阅读全文
posted @ 2018-09-11 14:35 FlyingWarrior 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 题目描述 给定一个未排序的整数数组,找出其中没有出现的最小的正整数。 示例 1: 示例 2: 示例 3: 说明: 你的算法的时间复杂度应为O(n),并且只能使用常数级别的空间。 解题思路 本题让只能使用常数级别的空间,所以哈希的解法只能放弃了。考虑另一种思路,把数字依次放到他们对应的位置上,比如1放 阅读全文
posted @ 2018-09-11 11:58 FlyingWarrior 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 题目描述 给定一个字符串 S 和一个字符串 T,请在 S 中找出包含 T 所有字母的最小子串。 示例: 说明: 如果 S 中不存这样的子串,则返回空字符串 ""。 如果 S 中存在这样的子串,我们保证它是唯一的答案。 解题思路 采用滑动窗口,窗口有左右边界,先通过扩展右边界找出一个包含T中所有字符的 阅读全文
posted @ 2018-09-07 15:02 FlyingWarrior 阅读(379) 评论(0) 推荐(0) 编辑
摘要: 问题描述 要求从N个元素中随机的抽取k个元素,其中N无法确定。例如: 这种应用的场景一般是数据流的情况下,由于数据只能被读取一次,而且数据量很大,并不能全部保存,因此数据量N是无法在抽样开始时确定的;但又要保持随机性,于是有了这个问题。 算法思想 算法证明 所以对于其中每个元素,被保留的概率都为k/ 阅读全文
posted @ 2018-09-06 18:26 FlyingWarrior 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 题目描述 给定正整数 n,找到若干个完全平方数(比如 1, 4, 9, 16, ...)使得它们的和等于 n。你需要让组成和的完全平方数的个数最少。 示例 1: 示例 2: 解题思路 利用动态规划思想解题,初始化dp数组令小于n的完全平方数为1,从1到n遍历求解最小组成个数,再对每个数遍历小于其的所 阅读全文
posted @ 2018-09-05 19:10 FlyingWarrior 阅读(1863) 评论(0) 推荐(1) 编辑
摘要: K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优 阅读全文
posted @ 2018-09-04 16:53 FlyingWarrior 阅读(986) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 21 下一页