2019年6月13日

数据库

摘要: 为什么用自增列作为主键 如果我们定义了主键(PRIMARY KEY),那么InnoDB会选择主键作为聚集索引 如果没有显式定义主键,则InnoDB会选择第一个不包含有NULL值的唯一索引作为主键索引、 如果也没有这样的唯一索引,则InnoDB会选择内置6字节长的ROWID作为隐含的聚集索引(ROWI 阅读全文

posted @ 2019-06-13 16:58 薛大明白 阅读(135) 评论(0) 推荐(0) 编辑

2019年5月27日

设计模式

摘要: 1,装饰者模式 动态地给一个对象增加一些额外的职责,增加对象功能来说,装饰模式比生成子类实现更为灵活。装饰模式是一种对象结构型模式。 由于具体构件类和装饰类都实现了相同的抽象构件接口,因此装饰模式以对客户透明的方式动态地给一个对象附加上更多的责任,换言之,客户端并不会觉得对象在装饰前和装饰后有什么不 阅读全文

posted @ 2019-05-27 10:20 薛大明白 阅读(125) 评论(0) 推荐(0) 编辑

2019年4月12日

机器学习/数据挖掘(机器学习基础部分)——摘自牛客网

摘要: 逻辑回归怎么实现多分类 方式一:修改逻辑回归的损失函数,使用softmax函数构造模型解决多分类问题,softmax分类模型会有相同于类别数的输出,输出的值为对于样本属于各个类别的概率,最后对于样本进行预测的类型为概率值最高的那个类别。 方式二:根据每个类别都建立一个二分类器,本类别的样本标签定义为 阅读全文

posted @ 2019-04-12 17:37 薛大明白 阅读(149) 评论(0) 推荐(0) 编辑

2019年4月10日

机器学习/数据挖掘(数学基础部分)——摘自牛客网

摘要: SGD,Momentum,Adagard,Adam原理 SGD为随机梯度下降,每一次迭代计算数据集的mini-batch的梯度,然后对参数进行更新。 Momentum参考了物理中动量的概念,前几次的梯度也会参与到当前的计算中,但是前几轮的梯度叠加在当前计算中会有一定的衰减。 Adagard在训练的过 阅读全文

posted @ 2019-04-10 20:01 薛大明白 阅读(382) 评论(0) 推荐(0) 编辑

2019年4月2日

面经

摘要: 蘑菇街笔试 1,为什么一般需要划分出额外的校验集(validation set)用于超参数调整,而不选择直接使用测试集(test set)? 因为验证数据集(Validation Set)用来调整模型参数从而选择最优模型,模型本身已经同时知道了输入和输出,所以从验证数据集上得出的误差(Error)会 阅读全文

posted @ 2019-04-02 19:26 薛大明白 阅读(603) 评论(0) 推荐(0) 编辑

2019年3月24日

SVM面经

摘要: 原始问题与对偶问题的关系 1,目标函数对原始问题是极大化,对对偶问题则是极小化 2,原始问题目标函数中的收益系数(优化函数中变量前面的系数)是对偶问题约束不等式中的右端常数,而原始问题约束不等式中的右端常数则是对偶问题中目标函数的收益系数 3,原始问题和对偶问题的约束不等式的符号方向相反 3,原始问 阅读全文

posted @ 2019-03-24 15:56 薛大明白 阅读(185) 评论(0) 推荐(0) 编辑

2019年2月22日

梯度下降和最小二乘总结

摘要: 梯度下降: 1,批量梯度(BGD),随机梯度下降法(SGD),小批量梯度下降法(MBGD)的区别 2,和最小二乘比较 1,梯度下降法需要选择步长,而最小二乘法不需要。 2,梯度下降法是迭代求解,最小二乘法是计算解析解。 3,最小二乘仅适用数据量较小的情况下 3,和牛顿法比较 1,梯度下降法是梯度求解 阅读全文

posted @ 2019-02-22 09:49 薛大明白 阅读(1439) 评论(0) 推荐(0) 编辑

2019年2月20日

决策树复习思路

摘要: 1,信息增益和信息增益比(熵和经验熵) 2,ID3算法思路,缺点 1,ID3没有考虑连续特征,比如长度,密度都是连续值,无法在ID3运用。这大大限制了ID3的用途。 2,ID3采用信息增益大的特征优先建立决策树的节点 3,ID3算法对于缺失值的情况没有做考虑 4,没有考虑过拟合的问题 3,C4.5如 阅读全文

posted @ 2019-02-20 10:24 薛大明白 阅读(167) 评论(0) 推荐(0) 编辑

2019年1月17日

KNN面试问题的总结

摘要: 1,简述一下KNN算法的原理 KNN既可以用于分类,也可以用于回归。本身没有显示的模型训练,多数情况用于分类算法。KNN算法我们主要要考虑三个重要的要素,对于固定的训练集,只要这三点确定了,算法的预测方式也就决定了。这三个最终的要素是k值的选取,距离度量的方式和分类决策规则。 1,K值的选择一般选择 阅读全文

posted @ 2019-01-17 12:57 薛大明白 阅读(1617) 评论(0) 推荐(0) 编辑

2019年1月8日

leetcode有意思的题目总结

摘要: 231. 2的幂 2^3=8 得 8是2的幂 判断一个整数是不是2的幂,可根据二进制来分析。2的幂如2,4,8,等有一个特点: 二进制数首位为1,其他位为0,如2为10,4为100 2&(2-1)=0 4&(4-1)=0 即得出结论如果一个数n为2的幂,则n(n-1)=0 258 各位相加的过程为: 阅读全文

posted @ 2019-01-08 12:02 薛大明白 阅读(544) 评论(0) 推荐(0) 编辑

导航