摘要:
恢复内容开始 数据库恢复技术 事务:是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。 事物的 ACID 特性:原子性、一致性、隔离性、持续性。 恢复的实现技术:建立冗余数据 -> 利用冗余数据实施数据库恢复。 建立冗余数据常用技术:数据转储(动态海量转储、动态 阅读全文
摘要:
关系数据理论 数据依赖是一个关系内部属性与属性之间的一种约束关系,是通过属性间值的相等与否体现出来的数据间相关联系。 最重要的数据依赖:函数依赖、多值依赖。 函数依赖是指关系中属性间(或者说是表中字段间)的对应关系。定义:设 R 为任一给定关系,如果对于 R 中属性 X 的每一个值,R 中的属性 Y 阅读全文
摘要:
数据结构和算法基础 索引的本质:数据结构,帮助高效获取数据 数据库的查询:最基本的查询算法当然是顺序查找(linear search)、二分查找(binary search)、二叉树查找(binary tree search)每种查找算法都只能应用于特定的数据结构之上,例如二分查找要求被检索数据有序 阅读全文
摘要:
1 介绍一下项目:项目背景,使用的方法 1.1 特征组合如何组合的 1.2 如何选择的特征,GBDT如何选择特征?(没懂什么意思,gbdt训练的时候应该是用的所有的特征,为什么还会有特征选择) 1.3 介绍一下blending方法。 1.4 介绍一下所有的模型各自使用的特征? 2 介绍一下特征提取的 阅读全文
摘要:
本文致力于对机器学习的相关模型进行学习总结,每个模型大概分成几个部分:模型简介,应用场景,优缺点,优化方法。以及实现demo。 首先介绍一下特征工程: 特征工程是完成一个机器学习的项目或者比赛的必备知识。 特征工程通常包括数据预处理,特征选择,降维等过程。 数据预处理: 阅读全文
摘要:
深度学习框架与应用 DNN CNN RNN Google Tensorflow, 社区发展资源多 facebook Pytorch, Caffe2 伯克利 Caffe, 亚马逊 MxNet Caffe Caffe 针对图像方面的任务,用于CNN 有 python 和 mathlab 的接口 通过不同 阅读全文
摘要:
1 数岛个数 1 1 1 0 1 1 1 0 0 1 1 0 1 0 0 0 0 0 0 0 结果为3 DFS:深度优先搜索,使用递归的遍历 BFS:广度优先遍历,使用队列记录 遍历:按照某种顺序访问“图”中所有的节点 顺序:深度优先(找最深的):栈 广度优先(找最近的):队列 时间复杂度 O(n+ 阅读全文
摘要:
(搬运工) 逻辑回归(LR)与SVM的联系与区别 LR 和 SVM 都可以处理分类问题,且一般都用于处理线性二分类问题(在改进的情况下可以处理多分类问题,如LR的Softmax回归用在深度学习的多分类中) 区别: 1、LR 是 参数模型,SVM是非参数模型,(svm中的 linear 和 rbf 是 阅读全文
摘要:
恢复内容开始 Softmax Regression 可以看做是 LR 算法在多分类上的推广,即类标签 y 的取值大于或者等于 2。 假设数据样本集为:$\left \{ \left ( X^{(1)},y ^{(1)} \right ) ,\left ( X^{(2)},y ^{(2)} \righ 阅读全文