摘要:
图 顶点 vertex:是图的基础部分 边 edge:如果一个边连接两个点,则表示两者具有联系,边可以是单向的也可以是双向的,如果一个图中的边都是单向的,我们就说这个图是有向图 权重 weight:一个顶点到另一个顶点的“代价”,可以给边赋权 路径 path:由边依次连接起来的顶点序列 圈 cycl 阅读全文
摘要:
为了使堆操作高效运行,我们将利用二叉树的操作复杂度为对数级这一性质来实现堆操作。同时使堆操作的复杂度始终保持在对数水平上,就必须保持二叉树的平衡,平衡二叉树树根左右子树有着相同的数量节点。完全二叉树,指每个内部节点都有两个子节点,最多可有一个节点列外。 完全树的另一个特性,我们可以用单个列表来实现完 阅读全文
摘要:
树的构成要素: 节点(Node) 边(Edge) 根节点(Root) 路径(Path) 子节点集(Children) 父节点(Parent) 兄弟节点(Sibling) 子树 (Subtree) 叶节点(Leaf Node) 层数(Level) 高度(height) 定义一:树有以下特征: 有一个节 阅读全文
摘要:
冒泡排序 冒泡排序需要对一个列表进行多次重复性遍历,他要比较相邻的两项,并且交换排错的项,每对列表进行一次遍历,就有一个最大的项排在正确的位置 此时的冒泡排序需要在最终位置找到之前不断交换数据项,因此也被认为是最低效的排序方法, 改良版的冒泡排序,循环过程中发现没有交换,我们就可以断定列表已经排好, 阅读全文
摘要:
排序与搜索 搜索的算法过程就是在一些项的集合中找到一个特定的项,搜索过程中会根据此项是否存在来给出回答True 或者False. 顺序搜索 从列表的第一项开始,我们按照初始顺序从一项移动到下一项,直到我们遍历所有的数据项。 一个无序列表顺序搜索的复杂度是O(n) 如果我们假设一个列表是按递增顺序构建 阅读全文
摘要:
动态规划 动态规划是用来求最优解问题的解决策略之一 一个最典型例子 :用最少的硬币找零 比如:一美元购买37美分商品,用来找零的硬币最小数量是多少(一般有1,5,10和25美分的硬币) 首先我们使用最大面值的硬币(25美分),也是尽可能多的使用,接着再使用下一个面值最大的这种方法被称为贪心算法 但如 阅读全文
摘要:
模型开发 注意:如果使用全模型法,所有自变量必须是连续型 data imputed;set imputed; 离散型的转化resr = (res='R');resu = (res='U');run;proc logistic data = imputed des; des表示1对应发生响应事件 mo 阅读全文
摘要:
逻辑回归 基本流程 模型开发阶段:数据处理 ——变量筛选和压缩——logit图——模型开发 模型验证:数据处理——误分类矩阵——ROC图——模型比较——模型确认 模型测试:收益矩阵——打分——决策 模型实施: 数据采样: 1、总体已知,反应数据过少,保留所有反应数据,使得反应数据在采样后的数据集占有 阅读全文
摘要:
逻辑回归 假设在自变量X1,X2,..Xn作用下,某事件发生的概率为p,则该事件不发生的概率为1-p ,p/(1-p) 为发生的概率和不发生的概率之比,记做优势odds 若对odds取自然对数,得到 称为P的logit变换, 则logistic回归模型为: 则概率计算公式为 没有连续的值的情况称作哑 阅读全文
摘要:
模型诊断 残差检验 y与y估计值的差异 要服从正态分布 模型诊断 学生化残差:标准差除以残差 1、如果是相对小的样本 该值应该在-2到+2之间 2、如果说相对大的样本 该值应该在-3到+3之间 强影响点判断 没有建立模型的意义 四个统计量判断 共线性诊断 方差膨胀因子: Ri是第i个变量与其他变量之 阅读全文