摘要: 第一章1定义:数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。2目的:把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。3分类:数据分析可划分为描述性数据分析,探索性数据分析和验证性数据分析。描述性分析是日常工作中主要的数据分析,有对比分析法、平均分析法、交叉分析法。而探索性数据分析以及验证性数据分析属于高级数据分析,常见的方法有相关分... 阅读全文
posted @ 2016-08-29 09:35 萱草yy 阅读(13531) 评论(0) 推荐(0) 编辑
摘要: 第1章:数据处理技巧案例1:数据:6,0000条不明飞行物(UFO)的目击纪录和报道。主要目击纪录发生在美国。问题:面对这份数据的时空维度,我们可能会有以下疑问:UFO的出现是否有周期性规律?美国的不同州出现的UFO记录如果有区别,有哪些区别?主要内容:日期的处理字符串地名的处理主要函数:#读入“\t”制表符数据,并设置列名称read.delim(" ", sep="\t", stringAsFa... 阅读全文
posted @ 2016-08-29 09:27 萱草yy 阅读(5194) 评论(0) 推荐(0) 编辑
摘要: 笔记:一、检验:1、平稳性检验:图检验方法: 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0(指数级衰减),反之非平稳序列衰减速度会比较慢 构造检验统计量进行假设检验:单位根检验adfTest()——fUnitRoots包2、纯随机性检验、白噪声检验(Box.t... 阅读全文
posted @ 2016-08-29 09:21 萱草yy 阅读(14501) 评论(0) 推荐(1) 编辑
摘要: 笔记: Dijkstra(迪杰斯特拉)算法:作用:计算源点到其它结点的最短路径方法:定义顶点集合S,初始状态S中只有源点s;定义dist数据,初始状态记录源点s经过顶点结合S{s}中的点到每个结点的最短路径长度.根据dist数组,将距离源点s最短的结点u加入顶点集合S中,再在dist数组中重新计算源点s经过顶点结合S{s,u}中的点到每个结点的最短路径长度。重复迭代,直到顶点集合S(到源点s距离从... 阅读全文
posted @ 2016-08-29 09:16 萱草yy 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 二叉树总共有4种遍历方法:例子:前序:中序:后序:层序:来自为知笔记(Wiz) 阅读全文
posted @ 2016-08-29 09:14 萱草yy 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 带问题思考以下几点:1、每个算法的思想是什么? 2、每个算法的稳定性怎样?时间复杂度是多少? 3、在什么情况下,算法出现最好情况 or 最坏情况? 4、每种算法的具体实现又是怎样的?1、直接插入排序:N每次选择一个元素K插入到之前已排好序的部分A[1…i]中,插入过程中K依次由后向前与A[1…i]中的元素进行比较。若发现发现A[x]>=K,则将K插入到A[x]的后面,插入前需要移动元素。效率: 时... 阅读全文
posted @ 2016-08-29 09:13 萱草yy 阅读(232) 评论(0) 推荐(0) 编辑