FlyingWarrior

2018年9月25日

摘要： XGBoost是GBDT的改进和重要实现，主要在于：提升算法 XGBoost也是一个加法模型，首先其在目标函数中加入了正则化项：泰勒级数 yi(t)是第i个实例在第t次迭代的预测值，需要加入 ft来最小化以下目标通过泰勒二阶展开近似来快速优化目标函数其中即l的一阶和二阶导数。移除常数项得到阅读全文

posted @ 2018-09-25 11:33 FlyingWarrior 阅读(2388) 评论(0) 推荐(0) 编辑

2018年9月21日

LeetCode 229. 求众数 II（Majority Element II ）

摘要：题目描述给定一个大小为 n 的数组，找出其中所有出现超过 ⌊ n/3 ⌋ 次的元素。说明: 要求算法的时间复杂度为 O(n)，空间复杂度为 O(1)。示例 1: 示例 2: 解题思路由于数组中出现次数超过 $\frac{1}{3}$ 的数字最多只可能为两个，所以记录两个数字n1、n2，以及他阅读全文

posted @ 2018-09-21 16:14 FlyingWarrior 阅读(442) 评论(0) 推荐(0) 编辑

梯度提升树GBDT总结

摘要：提升树的学习优化过程中，损失函数平方损失和指数损失时候，每一步优化相对简单，但对于一般损失函数优化的问题，Freidman提出了Gradient Boosting算法，其利用了损失函数的负梯度在当前模型的值：作为回归问题提升树算法的残差近似值，去拟合一个回归树。函数空间的数值优化优化目标是使得阅读全文

posted @ 2018-09-21 15:00 FlyingWarrior 阅读(358) 评论(0) 推荐(0) 编辑

2018年9月19日

正负样本不平衡问题

摘要：什么是类不平衡问题类不平衡（class-imbalance）是指在训练分类器中所使用的训练集的类别分布不均。比如说一个二分类问题，1000个训练样本，比较理想的情况是正类、负类样本的数量相差不多；而如果正类样本有995个、负类样本仅5个，就意味着存在类不平衡。在后文中，把样本数量过少的类别称为“ 阅读全文

posted @ 2018-09-19 18:36 FlyingWarrior 阅读(2576) 评论(0) 推荐(0) 编辑

2018年9月11日

LeetCode 20. 有效的括号（Valid Parentheses ）

摘要：题目描述给定一个只包括 '('，')'，'{'，'}'，'['，']' 的字符串，判断字符串是否有效。有效字符串需满足：注意空字符串可被认为是有效字符串。示例 1: 示例 2: 示例 3: 示例 4: 示例 5: 解题思路利用栈的思想，对于左括号直接入栈，对于右括号，判断栈顶元素是否为对应阅读全文

posted @ 2018-09-11 14:35 FlyingWarrior 阅读(164) 评论(0) 推荐(0) 编辑

LeetCode 41. 缺失的第一个正数（First Missing Positive）

摘要：题目描述给定一个未排序的整数数组，找出其中没有出现的最小的正整数。示例 1: 示例 2: 示例 3: 说明: 你的算法的时间复杂度应为O(n)，并且只能使用常数级别的空间。解题思路本题让只能使用常数级别的空间，所以哈希的解法只能放弃了。考虑另一种思路，把数字依次放到他们对应的位置上，比如1放阅读全文

posted @ 2018-09-11 11:58 FlyingWarrior 阅读(170) 评论(0) 推荐(0) 编辑

2018年9月7日

LeetCode 76. 最小覆盖子串（Minimum Window Substring）

摘要：题目描述给定一个字符串 S 和一个字符串 T，请在 S 中找出包含 T 所有字母的最小子串。示例：说明：如果 S 中不存这样的子串，则返回空字符串 ""。如果 S 中存在这样的子串，我们保证它是唯一的答案。解题思路采用滑动窗口，窗口有左右边界，先通过扩展右边界找出一个包含T中所有字符的阅读全文

posted @ 2018-09-07 15:02 FlyingWarrior 阅读(387) 评论(0) 推荐(0) 编辑

2018年9月6日

蓄水池采样问题

摘要：问题描述要求从N个元素中随机的抽取k个元素，其中N无法确定。例如：这种应用的场景一般是数据流的情况下，由于数据只能被读取一次，而且数据量很大，并不能全部保存，因此数据量N是无法在抽样开始时确定的；但又要保持随机性，于是有了这个问题。算法思想算法证明所以对于其中每个元素，被保留的概率都为k/ 阅读全文

posted @ 2018-09-06 18:26 FlyingWarrior 阅读(184) 评论(0) 推荐(0) 编辑

2018年9月5日

LeetCode 279. 完全平方数（Perfect Squares）

摘要：题目描述给定正整数 n，找到若干个完全平方数（比如 1, 4, 9, 16, ...）使得它们的和等于 n。你需要让组成和的完全平方数的个数最少。示例 1: 示例 2: 解题思路利用动态规划思想解题，初始化dp数组令小于n的完全平方数为1，从1到n遍历求解最小组成个数，再对每个数遍历小于其的所阅读全文

posted @ 2018-09-05 19:10 FlyingWarrior 阅读(1878) 评论(0) 推荐(1) 编辑

2018年9月4日

K-Means算法总结

摘要： K-Means算法是无监督的聚类算法，它实现起来比较简单，聚类效果也不错，因此应用很广泛。K-Means算法有大量的变体，本文从最传统的K-Means算法讲起，在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优阅读全文

posted @ 2018-09-04 16:53 FlyingWarrior 阅读(1004) 评论(0) 推荐(0) 编辑

step by step

公告