摘要: 基本排序:插入,选择,冒泡 三大排序:归并,快速,堆排 1、归并排序 -- 时间复杂度O(N*logN),空间复杂度O(N) 思路:递归方法,本质是压栈出栈的过程,关键点是找出递归的basecase,即问题划分到不能再往下划分的点,再将排好序的两部分合并即可 非递归方法,每相邻2个数排序,再下一层排 阅读全文
posted @ 2019-02-27 18:07 Luckid 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 理论基础: 1、小米笔试 https://github.com/imhuay/Algorithm_Interview_Notes-Chinese/blob/master/D-%E7%AC%94%E8%AF%95%E9%9D%A2%E7%BB%8F/%E7%AC%94%E8%AF%95-%E5%B0% 阅读全文
posted @ 2019-02-27 18:07 Luckid 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 1、最大似然估计解释最小二乘 2、求解参数 为啥加入扰动可以保证参数可解 3、正则化 L1 L2 (加入正则项的目的是为了防止过拟合) 当参数过拟合数据时,得到的参数分布不均衡,可能存在前边的参数很大,后边的参数很小的情况,所以在目标函数中加入参数的平方和乘以一个系数,来保证参数均衡,不至于有太大参 阅读全文
posted @ 2019-02-27 18:07 Luckid 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 1、熵是信息量的期望 公式: 2、联合熵:VENN图 条件熵: 3、正负样本不均衡处理: 4、数据与特征处理 阅读全文
posted @ 2019-02-27 18:06 Luckid 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 理论: Bagging思想:从总样本中每次抽取一定样本,去构建学习器,然后把学习器做投票或者平均,构成集成学习器 随机森林是Bagging思想的直接应用,取一部分的样本,取一部分的属性,采样过程是有放回的 问题: 1、信息增益跟基尼系数在数学上几乎相等,但ID3取信息增益下降最多的,CART选基尼系 阅读全文
posted @ 2019-02-27 18:06 Luckid 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 1、给出不同区间的列表,若有重叠区域则组合后输出 2、同类型的题目--今日头条(文章病句标识) 阅读全文
posted @ 2019-02-27 18:06 Luckid 阅读(72) 评论(0) 推荐(0) 编辑
摘要: 1、关键找出递推公式 阅读全文
posted @ 2019-02-27 18:06 Luckid 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 1、不均衡样本的处理方法即评价指标 当样本中正负样本相差悬殊时,单纯使用某一分类器分类或者准使用确率作为评价指标将使得模型在预测时不再work 因此会做一些处理,包括: 正样本>>负样本,且样本数量较大,则采用下采样或者欠采样,对小样本过采样,对大样本欠采样 正样本<<负样本,且样本数量不大,则可以 阅读全文
posted @ 2019-02-27 18:05 Luckid 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 1、函数间隔与几何间隔 函数间隔是垂直坐标系的距离,几何间隔是垂直分类面的距离 2、最优间隔分类器 3、拉格朗日求解 4、最优间隔分类器求解 5、SMO算法 6、核方法 7、软间隔分类器 8、合页损失函数 9、多分类 阅读全文
posted @ 2019-02-27 18:05 Luckid 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 1、链表相加 题目: 给定两个链表,分别表示两个非负整数,逆序存储在链表中,计算两个数的和,并返回链表头指针,如:输入:2->4->3、5->6->4,输出7->0->8 思路及代码: 2、链表翻转(部分翻转) 题目:给定一个链表,翻转该链表从m到n位置,直接反转不申请新空间 思路及代码: 3、排序 阅读全文
posted @ 2019-02-27 18:04 Luckid 阅读(140) 评论(0) 推荐(0) 编辑