摘要: 假设检验分参数假设和非参数假设。 假设 先假设原假设H0,对应的反面叫做备择假设H1。SAS一般沿用的规则是NEYMAN和PEARSON提出的:在控制犯第一类错误的原则下,是犯第二类错误的概率尽量小(即,原假设受到保护,不能轻易否定。若原假设被否定了,其理由一定是充分的)。反过来思考,若为了是假设更 阅读全文
posted @ 2017-02-13 23:07 immaculate 阅读(4713) 评论(0) 推荐(0) 编辑
摘要: 参数估计即通过样本计算出来的某个统计值来估计总体的统计值。 参数估计分点估计和区间估计。 点估计即,通过样本直接估计总体的某个指标(均值或者标准差等),估计的结果是一个确定的值。 区间估计即,通过样本估计总体的某个指标,估计的结果是一个区间(置信区间,在某个置信水平上的总体指标所在的区间)。 解释: 阅读全文
posted @ 2017-02-13 21:52 immaculate 阅读(988) 评论(0) 推荐(0) 编辑
摘要: EDA(探索性数据分析)最常用的过程步之一就是PROC UNIVARIATE。 首先先看一个最简单的PROC UNIVARIATE程序: 上述代码得到的结果有:矩、位置和可变形的基本测度、位置检验、分位数、极值观测。具体如下: 解读:首先看第一张表——矩,其中N=35代表该进入分析变量有35条观测, 阅读全文
posted @ 2017-02-07 20:17 immaculate 阅读(16698) 评论(1) 推荐(0) 编辑
摘要: 一、先从最宏观的角度来了解宏,这里的宏观角度是指程序的运行流程: 1,提交代码后,SAS先把代码读取储存到堆栈中; 2,用文本扫描插件来扫描堆栈中的代码,从上到下,从左到右; 3,扫描到一个分号,则编译之前的代码,(有错则警告报错或者停止扫描) 4,读到%,&的宏则马上调用宏编译器对宏进行替换,直到 阅读全文
posted @ 2017-01-16 22:06 immaculate 阅读(751) 评论(0) 推荐(0) 编辑
摘要: 虽然最后做成PPT里的图表会被要求用EXCEL画,但当我们只是在分析的过程中,想看看数据的走势,直接在SAS里画会比EXCEL画便捷的多。 修改起来也会更加的简单,,不用不断的修改程序然后刷新EXCEL里的透视表,,甚至有时还是需要重新插入图表等等麻烦的操作。 以下将介绍折线图(PROC GPLOT 阅读全文
posted @ 2017-01-04 22:18 immaculate 阅读(23277) 评论(1) 推荐(1) 编辑
摘要: PROC SORT 语法如上,其中在尖括号中的可以不出现,也不会报错。 选项中常用的有两种NODUPKEY和NOUNIQUEKEY。 功能可以由字面意思帮助记忆,NO-没有,DUP-重复,KEY-关键变量,,,合起来就是数据集中指定的关键变量不重复, 其功能也一样,,去除重复的关键变量,这里的关键变 阅读全文
posted @ 2016-12-27 21:05 immaculate 阅读(5725) 评论(0) 推荐(0) 编辑
摘要: 首先,抛开SAS,回忆我们在数学课本上学习的转置是什么概念,转置如下图: 以上就是数学中的转置。 那么在SAS里该如何转置呢? 先看语法格式: 其中,VAR variable(s); 确定要转置的数据,后面跟数据对应的变量名; 先看代码如下: 代码中先造了一个如上图的矩阵,在进行了转置,输出结果为下 阅读全文
posted @ 2016-12-12 22:43 immaculate 阅读(31065) 评论(0) 推荐(0) 编辑
摘要: 数据集中的数据来源分为两种: 一、来自于另一个数据集; 二、来自于外部数据源(本文细说此来源); 无论是哪种来源,在它们成为目标数据集中的观测行(官方叫它observation)之前都要进入PDV,先成为准观测行。 这里可以形象的把PDV 看作一个数据容器,在该容器中的数据即将成为目标数据集中的观测 阅读全文
posted @ 2016-12-11 16:43 immaculate 阅读(1320) 评论(0) 推荐(0) 编辑
摘要: 1,变量名命名规范:以字母或者下划线开始,可包含字母、下划线、数字,且不超过32个字符; 2,INFILE用于读取外部数据文件,一般于FILENAME(和LIBNAME用户一致,但路径要精确到文件名(、、.TXT/DAT等))连用。 3,INPUT语句用于定义字段变量,可用于读去外部文件(INFIL 阅读全文
posted @ 2016-12-10 22:46 immaculate 阅读(2659) 评论(0) 推荐(0) 编辑