04 2015 档案
摘要:第十二章:重抽样与自助法本章,我们将探究两种应用广泛的依据随机化思想的统计方法:置换检验和自助法12.1 置换检验置换检验,也称随机化检验或重随机化检验.有两种处理条件的实验,十个受试者已经被随机分配到其中一种条件(A或B)中,相应的结果变量(score)也已经被记录。实验结果如下:如果两种处理方式...
阅读全文
摘要:第十一章 中级绘图本节用到的函数有:plotlegendcorrgrammosaic11.2折线图如果将散点图上的点从左往右连接起来,那么就会得到一个折线图。创建散点图和折线图:> opar par(mfrow=c(1,2))> t1 plot(t1$age,t1$circumference,xla...
阅读全文
摘要:在绑定属性时,如果我们直接把属性暴露出去,虽然写起来很简单,但是,没办法检查参数,导致可以把成绩随便改:s = Student()s.score = 9999为了限制score的范围,可以通过一个set_score()方法来设置成绩,再通过一个get_score()来获取成绩,这样,在set_sco...
阅读全文
摘要:第十一章中级绘图本章内容:二元变量和多元变量关系的可视化绘制散点图和折线图理解相关图学习马赛克图和关联图本章用到的函数有:plothexbinablinesiplotscatterplotscatterplot3dpairsplot3dscatterplotMatrixscatter3dcpairs...
阅读全文
摘要:继承和多态在OOP程序设计中,当我们定义一个class的时候,可以从某个现有的class继承,新的class称为子类(Subclass),而被继承的class称为基类、父类或超类(Base class、Superclass)。>>> class Animal(object):#名为Animal的cl...
阅读全文
摘要:功效分析功效分析可以帮助在给定置信度的情况下,判断检测到给定效应值时所需的样本量。反过来,它也可以帮助你在给定置信度水平情况下,计算在某样本量内能检测到给定效应值的概率。如果概率低得难以接受,修改或者放弃这个实验将是一个明智的选择。10.1假设检验速览在研究过程时,研究者通常关注四个量:样本大小、显...
阅读全文
摘要:面向对象编程面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。为了简化程序设计,面向过程把函数继续切分为...
阅读全文
摘要:第九章方差分析9.2 ANOVA 模型拟合9.2.1 aov()函数aov(formula, data = NULL, projections =FALSE, qr = TRUE,contrasts = NULL, ...)9.2.2 表达式中各项的顺序y ~ A + B + A:B有三种类型的方法...
阅读全文
摘要:8.6 选择“最佳”的回归模型8.6.1 模型比较用基础安装中的anova()函数可以比较两个嵌套模型的拟合优度。所谓嵌套模型,即它的一些项完全包含在另一个模型中用anova()函数比较> states fit1fit2 anova(fit2,fit1)Analysis of Variance Ta...
阅读全文
摘要:高阶函数Higher-orderfunction变量可以指向函数>>> abs #abs(-10)是函数调用,而abs是函数本身>>> f = abs #函数本身也可以赋值给变量>>> f #变量可以指向函数>>> f(-10) #变量调用函数10函数名也是变量>>> abs = 10>>> abs...
阅读全文
摘要:8.4 异常观测值8.4.1 离群点car包也提供了一种离群点的统计检验方法。outlierTest()函数可以求得最大标准化残差绝对值Bonferroni调整后的p值:> library(car)> outlierTest(fit)rstudent unadjusted p-value Bonfe...
阅读全文
摘要:8.3回归诊断> fit par(mfrow=c(2,2))> plot(fit)为理解这些图形,我们来回顾一下oLs回归的统计假设。口正态性当预测变量值固定时,因变量成正态分布,则残差值也应该是一个均值为0的正态分布。正态Q-Q图(Normal Q-Q,右上)是在正态分布对应的值下,标准化残差的概...
阅读全文
摘要:定义函数def my_abs(x):#求绝对值的my_abs函数if x >= 0:return xelse:return –xdef nop():#空函数pass#占位符参数检查>>> my_abs(1, 2)Traceback (most recent call last):File "", l...
阅读全文
摘要:字符串和编码字符ASCIIUnicodeUTF-8A100000100000000 010000011000001中x01001110 0010110111100100 10111000 10101101格式化在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下:>>> 'Hell...
阅读全文
摘要:Something’s Wrong!Indications that something’s not rightmessage: A generic notification/diagnostic message produced by the message function;execution ...
阅读全文
摘要:数据类型和变量在Python中,能够直接处理的数据类型有以下几种:整数Python可以处理任意大小的整数,当然包括负整数,在程序中的表示方法和数学上的写法一模一样,例如:1,100,-8080,0,等等。十六进制用0x前缀和0-9,a-f表示,例如:0xff00,0xa5b4c3d2,等等。浮点数浮...
阅读全文
摘要:8.1回归的多面性8.2 OLS回归OLS回归拟合模型形式:为了能够恰当地解释oLs模型的系数,数据必须满足以下统计假设。口正态性对于固定的自变量值,因变量值成正态分布。口独立性Yi值之间相互独立。口线性因变量与自变量之间为线性相关。口同方差性因变量的方差不随自变量的水平不同而变化。也可称作不变方差...
阅读全文
摘要:Looping on the Command LineWriting for, while loops is useful when programming but not particularly easy when working interactively on the command lin...
阅读全文
摘要:7.3相关相关系数可以用来描述定量变量之间的关系。相关系数的符号(±)表明关系的方向(正相关或负相关),其值的大小表示关系的强弱程度(完全不相关时为0,完全相关时为1)。除了基础安装以外,我们还将使用psych和ggm包。7.3.1 相关的类型1.Pearson、Spearman和Kendall相关...
阅读全文
摘要:1.1 引言多元统计分析(简称多元分析)是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,它是一元统计学的推广.在实际间题中,很多随机现象涉及到的变量不是一个,而经常是多个变量,并且这些变量间又存在一定的联系.英国著名统计学家肯德尔(Kendall)在《多元分析》一书中把多元统计分析所研究...
阅读全文
摘要:简介Python(英语发音:/ˈpaɪθən/), 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年,Python 源代码同样遵循 GPL(GNU General Public License)协议[1] 。Python...
阅读全文
摘要:A Diversion on Binding Values to SymbolWhen R tries to bind a value to a symbol,it searches through a series of environments to find the appropriate v...
阅读全文
摘要:7.2 频数表和列联表> library(vcd)> head(Arthritis)ID Treatment Sex Age Improved1 57 Treated Male 27 Some2 46 Treated Male 29 None3 77 Treated Male 30 None4 17...
阅读全文
摘要:7.1描述性统计分析> vars head(mtcars[vars]) mpg hp wtMazda RX4 21.0 110 2.620Mazda RX4 Wag 21.0 110 2.875Datsun 710 22.8 93 2.320Hornet 4 Drive 21.4 110 3.215...
阅读全文
摘要:Control StructuresControl structures in R allow you to control the flow of execution of the program, depending onruntime conditions. Common structures...
阅读全文
摘要:6.3直方图 hist()其中的x是一个由数据值组成的数值向量。参数freq=FALSE表示根据概率密度而不是频数绘制图形。参数breaks用于控制组的数量。在定义直方图中的单元时,默认将生成等距切分。par(mfrow=c(2,2))hist(mtcars$mpg)#简单直方图hist(mtcar...
阅读全文
摘要:SubsettingThere are a number of operators that can be used to extract subsets of R objects.[ always returns an object of the same class as the origina...
阅读全文
摘要:Reading DataThere are a few principal functions reading data into R.read.table, read.csv, for reading tabular datareadLines, for reading lines of a te...
阅读全文
摘要:第六章 基本图形6.1条形图条形图通过垂直的或水平的条形展示了类别型变量的分布(频数)。函数:barplot(height)6.1.1简单的条形图6.1.2推砌条形图和分组条形图如果height是一个矩阵而不是一个向量,则绘图结果将是一幅堆砌条形图或分组条形图。若beside=FALSE(默认值),...
阅读全文
摘要:ObjectsR has five basic or “atomic” classes of objects: character numeric (real numbers) integer complex logical (True/False)The most basic object is ...
阅读全文
摘要:5.4 控制流 语句(statement)是一条单独的R语句或一组复合语句(包含在花括号{ } 中的一组R语句,使用分号分隔); 条件(cond)是一条最终被解析为真(TRUE)或假(FALSE)的表达式; 表达式(expr)是一条数值或字符串的求值语句;q 序列(seq)是一个数值或字符串序...
阅读全文
摘要:5.2.1数学函数函数描述abs(x)绝对值sqrt(x)平方根ceiling(x)不小于x的最小整数floor(x)不大于x的最大整数trunc(x)向0的方向截取的X中的整数部分round(x,digits=n)将x舍入为指定位的小数signif(x, digits=n)将x舍入为指定的有效数字...
阅读全文