摘要:
https://www.toutiao.com/a6520005731867951619/?tt_from=weixin&utm_campaign=client_share×tamp=1518062687&app=news_article_social&utm_source=weixin& 阅读全文
摘要:
https://www.cnblogs.com/xhj123/p/6032683.html 正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板 阅读全文
摘要:
维特比乍法是一个特殊但应用最广的动态规划算法,可以解决任何一个图中的最短路径问题。 这个算法是针对一个特殊的图——篱笆网络的有向图的最短路径提出的。 这个算法之所以重要,是因为凡是使用隐含马尔科夫模型描述的问题都可以用它来解码,包括今天 的数字通信,语音识别,拼音转汉字,分词等。 算法基础: 1、如 阅读全文
摘要:
对计算好的相关系数进行显著性检验。 原假设:变量间不相关,即总体的相关系数为0。 cor.test()对单个的 Pearson、Spearman 和 Kendall 相关系数进行检验。、 格式:cor.test(x, y, alternative=, method=) x,y: 为要检验相关性的变量 阅读全文
摘要:
1、 计算相关系数 (1) cor()函数可以计算以下三种相关系数: (2) Pearson 极差相关系数:两个连续变量之间的线性相关程度。 (3) Spearman 等级相关系数:等级变量之间的相关程度。 (4) Kendall 等级相关系数:非参数的等级相关度量。 (5) 语法:cor(data 阅读全文
摘要:
Kendall's tau-b(肯德尔)等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格; 计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定 阅读全文
摘要:
Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计 阅读全文
摘要:
Pearson(皮尔逊)相关系数:也叫pearson积差相关系数。衡量两个连续变量之间的线性相关程度。 当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。 Pearson相关系数公式如下: Pearson(皮尔逊)相关系 阅读全文
摘要:
变异系数:CV=标准差/均值*100% 协方差:用来度量两个随机变量关系的统计量。 公式简单翻译一下是:对于X,Y两个变量,每个时刻的“X值与其均值之差” 乘以 “Y值与其均值之差”得到一个乘积,再对这每时刻的乘积求和并求出均值。 总结一下,如果协方差为正,说明X,Y同向变化,协方差越大说明同向程度 阅读全文
摘要:
定义:设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n.[1] F分布:设X、Y为两个独立的随机变量,X服从自由度为n的卡方分布,Y服从自由度为m的卡方分布,这两个独立的 阅读全文
摘要:
1.1 定义 定义:假设X服从标准正态分布N(0,1),Y服从卡方分布,那么的分布称为自由度为n的t分布,记为。 T分布密度函数其中,Gam(x)为伽马函数。 可用于两组独立计量资料的假设检验。 由于在实际工作中,往往σ(总体方差)是未知的,常用s(样本方差)作为σ总体方差的估计值,为了与u变换(正 阅读全文
摘要:
1.1 定义 设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X12+X22+......+Xn2所服从的分布为自由度为 n 的χ2分布.[1] 卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。 卡方分布:若n个相互独立的随机变量ξ₁、ξ₂、…… 阅读全文
摘要:
【正态分布】(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution) 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。 当μ = 0,σ = 1时的正态分布是标准正态分布。 正态分布有两个参数,即期 阅读全文
摘要:
一、确定资料的类型:分类资料、定量资料; 选择适当的统计方法,资料不同,设计不同,采用的分析方法不同;1、计量资料的比较(比较集中趋势是否不同): (1)两组:t检验、Wilcoxon秩和检验 … t分布(近似正态分布):用于根据小样本来估计呈正态分布且方差未知的总体的均值。 定义:假设X服从标准正 阅读全文
摘要:
1.1.1 上下文选择符 用于选择指定祖先后代的元素。 article p {font-weight:bold;}【上面这条规则的目标是位于article 上下文中的p 元素】 1.1.1.1 子选择符> section > h2 {font-style:italic;}【选择section 标签下 阅读全文
摘要:
1.1 引用类型 1.1.1 Object类型 创建 Object 实例的方法有两种: (1)使用 new 操作符: var person=new Object(); person.name="Ema"; person.age=27; (2)使用对象字面量表示法: var person={ "nam 阅读全文
摘要:
1.1 内置对象 开发人员不需要显示地实例化内置对象,因为它们已经实例化了。 Object Array String Global Math 1.1.1 Global 1.1.1.1 URI编码 //有效的 URI 中不能包含某些字符,如空格,下面这两个方法用特殊的UTF-8编码替换所有无效字符,从 阅读全文
摘要:
http://www.cnblogs.com/liaojie970/p/5210541.html 比如<select class="selector"></select> 1、设置value为pxx的项选中 $(".selector").val("pxx"); 2、设置text为pxx的项选中 $( 阅读全文
摘要:
一、统计描述指标的选择与应用 计量资料:集中趋势与离散趋势(1)正态分布:均数标准差 (2)非正态分布(偏态、不规则分布):中位数(M),四分位数 (P25、P75) 无序分类资料:率、构成比 二、集中趋势与离散趋势集中趋势:用平均数(指标体系)反映一组观察值的中心位置或平均水平。 (1)算数均数 阅读全文
摘要:
频率是就样本而言的,而概率从总体的意义上说的,频率f/n 是 概率 p(A)的估计值。样本频率总是围绕概率上下波动。样本含量n越大,波动幅度越小,频率越接近概率。即试验次数越多,估计越可靠。 统计描述:用统计指标、统计表、统计图等方法,对样本资料的数量特征及其分布规律进行描述。统计推断:指用样本信息 阅读全文
摘要:
检验某学区所有在售房源中,小区与楼栋类别(低层;多层;小高层;高层)是否相关 导入数据: 结果如下: 生成列联表(频数表): 看一下新表格: 结果如下: 结果如下: 独立性检验 1、卡方检验:对二维表的行变量和列变量进行卡方独立性检验。 卡方分布—— n个独立的标准正态分布变量的平方和服从自由度为 阅读全文
摘要:
统计学区内各个小区的房价均值 数据格式 id|community_name|house_area|house_structure|house_total|house_avg|agency_name|house_floor_curr|house_floor_total|house_floor_type 阅读全文
摘要:
一组数据怎样去评价和量化它的离散度,有很多种方法: 标准差极差 标准差极差 最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分就是极差的具体应用。 标准差离均差平方和 标准差离均差平方和 由于误差的不可控性,因此只由两 阅读全文
摘要:
http://blog.csdn.net/xidiancoder/article/details/71341345 平均值 平均值的概念很简单:所有数据之和除以数据点的个数,以此表示数据集的平均大小;其数学定义为 以下面10个点的CPU使用率数据为例,其平均值为17.2。 1 方差、标准差 方差这一 阅读全文
摘要:
下载并安装 “sqldf” 包 library(sqldf) newData <- sqldf("select * from mtcars where carb=1 order by mpg", row.names=TRUE) row.names=TRUE将原始数据框中的行名延续到了新数据框中 阅读全文
摘要:
1、列选择 (1)下标方式 newData <- leadership 【, c(6:10)】 选择全部行和第6到第10列;将行下标留空表示选择所有行。 (2)列名集合方式 newData <- leadership【c("q1", "q2", "q3", "q4", "q5")】 2、列剔除 (1 阅读全文
摘要:
1、创建新变量 方式 一:常规方式,用已有变量组合新变量; 方式二:使用 attach()函数,不用再带数据框变量名; 方式三:使用 transform()函数,按需创建变量,并将其保存到数据框中 mydata<- transform(mydata, sum= x1 + x2, mean = (x1 阅读全文
摘要:
变量分类 : (1)离散型: (a)有序:如病情,表示顺序有关系 ,但不知道相差多少。 ( b)无序:没 顺序关系,如糖尿病分型。 (2)连续型:同时体现顺序和数量。 factor()函数;将向量因子化,抽象成 整数向量。 阅读全文
摘要:
阅读全文
摘要:
注释:# 赋值:<- 查看、设定当前工作目录:getwd() setwd() wd:workspace directory【setwd("c:/myproject/project1")】 在独立的目录中保存项目是个好主意。 文本输出:函数 skin("fileName")将输出重定向到文件 中。不加 阅读全文