05 2015 档案

摘要:卡方检验的功能与意义SPSS的卡方检验是非参数检验方法的一种,其基本功能足通过样本的频数分布来推断总体是否服从某种理论分布或某种假设分布,这种检验过程是通过分析实际的频数与理论的频数之间的差别或是说吻合程度来完成的。相关数据随机抽取100名某地新生婴儿性别。研究该地区新生婴儿男女比例是否存在明显的差... 阅读全文
posted @ 2015-05-27 21:53 机器学习算法与Python 阅读(3202) 评论(0) 推荐(0) 编辑
摘要:假设检验及R实现7.1假设检验概述对总体参数的具体数值所作的陈述,称为假设;再利用样本信息判断假设足否成立,这整个过程称为假设检验。7.1.1理论依据假设检验之所以可行,其理沦背景是小概率理论。小概率事件在一次试验中儿乎是不可能发生的,但是它一以发生,我们就有理由拒绝原假设:反之,小概率事件没有发生... 阅读全文
posted @ 2015-05-25 23:09 机器学习算法与Python 阅读(12078) 评论(1) 推荐(1) 编辑
摘要:单一样本t检验的功能与意义spss的单一样本t检验过程是瑕设检验中最基本也是最常用的方法之一,跟所有的假没检验一样,其依剧的基木原理也是统计学中的‘小概率反证法”原理。通过单一样本t检验。我们可以实现样本均值和总体均值的比较,所以单一样本t检验过程也属于均值比较这一体系例:高校体检第一次体检男生平均... 阅读全文
posted @ 2015-05-25 22:50 机器学习算法与Python 阅读(1638) 评论(0) 推荐(0) 编辑
摘要:6.3两正态总体的区间估计(1)两个总体的方差已知在R中编写计算置信区间的函数twosample.ci()如下,输入参数为样本x, y,置信度α和两个样本的标准差。> twosample.ci=function(x,y,alpha,sigma1,sigma2){+ n1=length(x);n2... 阅读全文
posted @ 2015-05-23 22:55 机器学习算法与Python 阅读(4754) 评论(0) 推荐(2) 编辑
摘要:6.1点估计及R实现6.1.1矩估计R中的解方程函数:函数及所在包:功能uniroot()@stats:求解一元(非线性)方程multiroot()@rootSolve:给定n个(非线性)方程,求解n个根uniroot.all()@rootSolve:在一个区问内求解一个方程的多个根BBsolve(... 阅读全文
posted @ 2015-05-22 21:28 机器学习算法与Python 阅读(23933) 评论(0) 推荐(1) 编辑
摘要:6.1创建函数函数是可以调用(可能包含参数,也就是放在圆括号中的值),它执行某种行为并且返回一个值。一般来说,内建的callable函数可以用来判断函数是否可调用:>>> x=1>>> y=math.sqrt>>> callable(x)False>>> callable(y)True定义函数用de... 阅读全文
posted @ 2015-05-21 08:17 机器学习算法与Python 阅读(870) 评论(0) 推荐(0) 编辑
摘要:5.5.1while循环x=1while x>> zip(names,ages)[('anne', 12), ('beth', 45), ('george', 32), ('damon', 102)]循环中解包元组:>>> for name,age in zip(names,ages): pr... 阅读全文
posted @ 2015-05-19 22:11 机器学习算法与Python 阅读(858) 评论(0) 推荐(0) 编辑
摘要:5.6 多组数据分析及R实现5.6.1 多组数据的统计分析> group=read.csv("C:/Program Files/RStudio/002582.csv")> group=na.omit(group) #忽略缺失样本> summary(group) 时间 ... 阅读全文
posted @ 2015-05-19 12:02 机器学习算法与Python 阅读(3866) 评论(2) 推荐(1) 编辑
摘要:5.1R内置的分布分布是描述一个样本数据最核心、最重要的方式。R内嵌了很多常用的统计分布,提供了四类函数:概率密度函数(density),累积分布函数(probability)、分位数(quantile)和伪随机数(random)。在R中分别用d,p,q,r表示这4个项目,后面接分布的英文名称或缩写... 阅读全文
posted @ 2015-05-18 23:07 机器学习算法与Python 阅读(3159) 评论(0) 推荐(0) 编辑
摘要:5.1 print和import的更多信息5.1.1使用逗号输出打印多个表达式也是可行的,只要将它们用逗号隔开就好:>>>print'age:',42age: 42 要同时输出文本和变量值,却又不希望使用字符串格式化:>>> name='Gumby'>>> salutation='Mr.'>>> ... 阅读全文
posted @ 2015-05-17 22:45 机器学习算法与Python 阅读(1084) 评论(1) 推荐(0) 编辑
摘要:4.1 R绘图概述以下两个函数,可以分别展示二维,三维图形的示例:>demo(graphics)>demo(persp)R提供了多种绘图相关的命令,可分成三类:高级绘图命令:在图形设备上产生一个新的图区,它可能包括坐标轴、标签、标题等。低级绘图命令:在一个己经存在的图形上加上更多的图形元素,如额外的... 阅读全文
posted @ 2015-05-16 22:58 机器学习算法与Python 阅读(4379) 评论(1) 推荐(0) 编辑
摘要:3.3缺失值处理R中缺失值以NA表示,判断数据是否存在缺失值的函数有两个,最基本的函数是is.na()它可以应用于向量、数据框等多种对象,返回逻辑值。> attach(data)The following objects are masked fromdata (pos = 3):city, pri... 阅读全文
posted @ 2015-05-15 21:22 机器学习算法与Python 阅读(3338) 评论(0) 推荐(0) 编辑
摘要:2.1序列概览列表和元组的主要区别在于,列表可以修改,元组则不能。也就是说如果要根据要求来添加元素,那么列表可能会更好用;而出于某些原因,序列不能修改的时候,使用元组则更为合适。使用后者的理由通常是技术性的,它与Python内部的运作方式有关。这也是内建函数可能返回元组的原因。一般来说,在几乎所有的... 阅读全文
posted @ 2015-05-14 09:32 机器学习算法与Python 阅读(528) 评论(0) 推荐(0) 编辑
摘要:1.1数据分析概述1.1.1数据分析的原则(1)数据分析是为了验证假设的问题,需要提供必要的数据验证。在数据分析中,分析模型构建完成后,需要利用测试数据验证模型的正确性。(2)数据分析是为了挖掘更多的问题,并找到深层次的原因。(3)不能为了做数据分析而做数据分析。1.1.2数据分析的步骤(1)探索性... 阅读全文
posted @ 2015-05-14 09:28 机器学习算法与Python 阅读(1913) 评论(2) 推荐(1) 编辑
摘要:一、playwith包简介playwith包提供了一个GTK+图形用户界面(GUI),使得用户可以编辑R图形并与其交互。playwith()函数允许用户识别和标注点、查看一个观测所有的变量值、缩放和旋转图形、添加标注(文本、箭头、线条、矩形、标题和标签)、修改视觉元素(颜色、文本大小等)、应用先前存... 阅读全文
posted @ 2015-05-12 14:39 机器学习算法与Python 阅读(1352) 评论(0) 推荐(0) 编辑
摘要:16.2.4 图形参数在lattice图形中,lattice函数默认的图形参数包含在一个很大的列表对象中,你可通过trellis.par.get()函数来获取,并用trellis.par.set()函数来修改。show.settings()函数可展示当前的图形参数设置情况。查看当前的默认设置,并将它... 阅读全文
posted @ 2015-05-11 23:08 机器学习算法与Python 阅读(1708) 评论(0) 推荐(2) 编辑
摘要:16.1 R 中的四种图形系统基础图形函数可自动调用,而grid和lattice函数的调用必须要加载相应的包(如library(lattice))。要调用ggplot2函数需下载并安装该包(install.packages("ggplot2")),第一次使用前还要进行加载(library(ggplo... 阅读全文
posted @ 2015-05-11 08:52 机器学习算法与Python 阅读(1113) 评论(0) 推荐(1) 编辑
摘要:处理缺失数据的高级方法15.1 处理缺失值的步骤一个完整的处理方法通常包含以下几个步骤:(1) 识别缺失数据;(2) 检查导致数据缺失的原因;(3) 删除包含缺失值的实例或用合理的数值代替(插补)缺失值。缺失数据的分类:(1) 完全随机缺失:若某变量的缺失数据与其他任何观测或未观测变量都不相关,则数... 阅读全文
posted @ 2015-05-07 23:04 机器学习算法与Python 阅读(1356) 评论(1) 推荐(1) 编辑
摘要:第十四章:主成分和因子分析本章内容主成分分析探索性因子分析其他潜变量模型主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测... 阅读全文
posted @ 2015-05-06 22:12 机器学习算法与Python 阅读(5198) 评论(0) 推荐(3) 编辑
摘要:调试第一种方法简单直接粗暴有效,就是用print把可能有问题的变量打印出来看看:>>> def foo(s):n= int(s)print '>>> n = %d' % nreturn 10 / n>>> def main():foo('0')>>> main()>>> n = 0Traceback... 阅读全文
posted @ 2015-05-06 11:31 机器学习算法与Python 阅读(2154) 评论(0) 推荐(0) 编辑
摘要:12.4 置换检验点评除coin和lmPerm包外,R还提供了其他可做置换检验的包。perm包能实现coin包中的部分功能,因此可作为coin包所得结果的验证。corrperm包提供了有重复测量的相关性的置换检验。logregperm包提供了Logistic回归的置换检验。另外一个非常重要的包是gl... 阅读全文
posted @ 2015-05-04 23:30 机器学习算法与Python 阅读(2752) 评论(0) 推荐(1) 编辑