2019 年 2月 27 日随笔档案 - Luckid

2019年2月27日

摘要：基本排序：插入，选择，冒泡三大排序：归并，快速，堆排 1、归并排序 -- 时间复杂度O(N*logN)，空间复杂度O(N) 思路：递归方法，本质是压栈出栈的过程，关键点是找出递归的basecase，即问题划分到不能再往下划分的点，再将排好序的两部分合并即可非递归方法，每相邻2个数排序，再下一层排阅读全文

posted @ 2019-02-27 18:07 Luckid 阅读(177) 评论(0) 推荐(0) 编辑

图的遍历（深度优先DFS和广度优先BFS）

摘要：理论基础： 1、小米笔试 https://github.com/imhuay/Algorithm_Interview_Notes-Chinese/blob/master/D-%E7%AC%94%E8%AF%95%E9%9D%A2%E7%BB%8F/%E7%AC%94%E8%AF%95-%E5%B0% 阅读全文

posted @ 2019-02-27 18:07 Luckid 阅读(193) 评论(0) 推荐(0) 编辑

回归问题

摘要： 1、最大似然估计解释最小二乘 2、求解参数为啥加入扰动可以保证参数可解 3、正则化 L1 L2 （加入正则项的目的是为了防止过拟合）当参数过拟合数据时，得到的参数分布不均衡，可能存在前边的参数很大，后边的参数很小的情况，所以在目标函数中加入参数的平方和乘以一个系数，来保证参数均衡，不至于有太大参阅读全文

posted @ 2019-02-27 18:07 Luckid 阅读(190) 评论(0) 推荐(0) 编辑

熵与EM算法

摘要： 1、熵是信息量的期望公式： 2、联合熵：VENN图条件熵： 3、正负样本不均衡处理： 4、数据与特征处理阅读全文

posted @ 2019-02-27 18:06 Luckid 阅读(178) 评论(0) 推荐(0) 编辑

决策树

摘要：理论： Bagging思想：从总样本中每次抽取一定样本，去构建学习器，然后把学习器做投票或者平均，构成集成学习器随机森林是Bagging思想的直接应用，取一部分的样本，取一部分的属性，采样过程是有放回的问题： 1、信息增益跟基尼系数在数学上几乎相等，但ID3取信息增益下降最多的，CART选基尼系阅读全文

posted @ 2019-02-27 18:06 Luckid 阅读(100) 评论(0) 推荐(0) 编辑

leetcode-56

摘要： 1、给出不同区间的列表，若有重叠区域则组合后输出 2、同类型的题目--今日头条（文章病句标识）阅读全文

posted @ 2019-02-27 18:06 Luckid 阅读(72) 评论(0) 推荐(0) 编辑

动态规划

摘要： 1、关键找出递推公式阅读全文

posted @ 2019-02-27 18:06 Luckid 阅读(67) 评论(0) 推荐(0) 编辑

特征工程处理

摘要： 1、不均衡样本的处理方法即评价指标当样本中正负样本相差悬殊时，单纯使用某一分类器分类或者准使用确率作为评价指标将使得模型在预测时不再work 因此会做一些处理，包括：正样本>>负样本，且样本数量较大，则采用下采样或者欠采样，对小样本过采样，对大样本欠采样正样本<<负样本，且样本数量不大，则可以阅读全文

posted @ 2019-02-27 18:05 Luckid 阅读(310) 评论(0) 推荐(0) 编辑

SVM

摘要： 1、函数间隔与几何间隔函数间隔是垂直坐标系的距离，几何间隔是垂直分类面的距离 2、最优间隔分类器 3、拉格朗日求解 4、最优间隔分类器求解 5、SMO算法 6、核方法 7、软间隔分类器 8、合页损失函数 9、多分类阅读全文

posted @ 2019-02-27 18:05 Luckid 阅读(91) 评论(0) 推荐(0) 编辑

链表

摘要： 1、链表相加题目：给定两个链表，分别表示两个非负整数，逆序存储在链表中，计算两个数的和，并返回链表头指针，如：输入：２－＞４－＞３、５－＞６－＞４，输出７－＞０－＞８思路及代码： 2、链表翻转（部分翻转）题目：给定一个链表，翻转该链表从m到n位置，直接反转不申请新空间思路及代码： 3、排序阅读全文

posted @ 2019-02-27 18:04 Luckid 阅读(140) 评论(0) 推荐(0) 编辑

Luckid

公告