摘要: 假如已经有如下的XML字符:通过使用DataSet自带的ReadXML()方法,可以自动生成3个DataTables,其中两个的名字及数据如下:还有一个名为storeCodeOutlets的DataTable,但是没有数据。主要代码如下:using (System.IO.StringReader r... 阅读全文
posted @ 2015-05-29 13:21 wangyubo 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?处理 发癌数 未发癌数 合计 发癌率%甲组 52 19 71 73.24乙组 39 3 42 92.86合计 91 22 113 80.33 52 19 39 3是表中最基本的数据,因... 阅读全文
posted @ 2015-04-23 15:43 wangyubo 阅读(776) 评论(0) 推荐(0) 编辑
摘要: 独立性检验(Test for Independence)是根据频数来判断两类因子是彼此独立还是彼此相关的一种假设检验。假如对某一个数据集有X(值域为x1, x2)跟Y(值域为y1, y2)变量,下面是他们的频数表:x1x2汇总y1aba+by2cdc+d汇总a+cb+dn = a+b+c+d我们可以... 阅读全文
posted @ 2015-04-23 15:42 wangyubo 阅读(4605) 评论(0) 推荐(0) 编辑
摘要: 频数表是将数据集按照某个特定列分类(分组)时观察每个类/组中数据出现次数的表;列联表也是频数表,只不过它会分析的是将数据集按两个或两个以上类别变量联合分组时观察数据在每个分组中出现频数的表,所以又称交叉分类表。简介特殊地,如果我们使用样本数据的两个属性构建列联表,而且每个属性只有两个等级,那么我们会... 阅读全文
posted @ 2015-04-23 15:40 wangyubo 阅读(2122) 评论(0) 推荐(0) 编辑
摘要: 测量尺度(scale of measure)或称度量水平(level of measurement)、度量类别,是统计学和定量研究中,对不同种类的数据,依据其尺度水平所划分的类别,这些尺度水平分别为:名目(nominal)、次序(ordinal)、等距(interval)、等比(ratio)。名目尺... 阅读全文
posted @ 2015-04-23 15:39 wangyubo 阅读(3714) 评论(0) 推荐(0) 编辑
摘要: 在概率论和统计学中,相关(Correlation,或称相关系数或关联系数)显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下,有许多根据数据特点而定义的用来衡量数据相关的系数。对于不同测量尺度的变量,有不同的相关系数可用:Pe... 阅读全文
posted @ 2015-04-23 15:37 wangyubo 阅读(3474) 评论(0) 推荐(0) 编辑
摘要: T检验,亦称student t检验(Student's t test),主要用于①样本含量较小(例如n<30),②总体标准差σ未知的③正态分布资料。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与z检验、卡方检验并列。T检验分为三种方法:单一样本t检验(One-sam... 阅读全文
posted @ 2015-04-23 15:36 wangyubo 阅读(970) 评论(0) 推荐(0) 编辑
摘要: 一、方法1: 单文件模块直接把文件拷贝到 $python_dir/Lib二、方法2: 多文件模块,带setup.py下载模块包,进行解压,进入模块文件夹,执行:python setup.py install三、 方法3:easy_install 方式先下载ez_setup.py,运行python e... 阅读全文
posted @ 2015-04-23 11:20 wangyubo 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 操作XML有两种主要方法:DOM和SAX。DOM会把整个XML读入内存,解析为树,因此占用内存大,解析慢,优点是可以任意遍历树的节点。SAX是流模式,边读边解析,占用内存小,解析快,缺点是我们需要自己处理事件。1. DOM是基于内存的,不管文件有多大,都会将所有的内容预先装载到内存中。从而消耗很大的... 阅读全文
posted @ 2015-04-23 11:10 wangyubo 阅读(220) 评论(0) 推荐(0) 编辑
摘要: Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于2的6次方等于64,所以每6个比特为一个单元,对应某个可打印字符。三个字节有24个比特,对应于4个Base64单元,即3个字节需要用4个可打印字符来表示。它可用来作为电子邮件的传输编码。在Base64中的可打印字符包括字母A-Z、... 阅读全文
posted @ 2015-04-23 10:54 wangyubo 阅读(209) 评论(0) 推荐(0) 编辑