quietwalk - 博客园

2018年2月9日

开源VS商用，IBM区块链从Hyperledger到商用平台之道 | 对话IBM高级架构师【笔记】（转）

摘要： https://www.toutiao.com/a6520005731867951619/?tt_from=weixin&utm_campaign=client_share&timestamp=1518062687&app=news_article_social&utm_source=weixin& 阅读全文

posted @ 2018-02-09 09:06 quietwalk 阅读(238) 评论(0) 推荐(0)

2018年1月23日

java中正则表达式基本用法（转）

摘要： https://www.cnblogs.com/xhj123/p/6032683.html 正则表达式是一种可以用于模式匹配和替换的规范，一个正则表达式就是由普通的字符（例如字符a到z）以及特殊字符（元字符）组成的文字模式，它用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板阅读全文

posted @ 2018-01-23 16:04 quietwalk 阅读(7641) 评论(0) 推荐(0)

2018年1月22日

《数学之美》——维特比和他维特比算法

摘要：维特比乍法是一个特殊但应用最广的动态规划算法，可以解决任何一个图中的最短路径问题。这个算法是针对一个特殊的图——篱笆网络的有向图的最短路径提出的。这个算法之所以重要，是因为凡是使用隐含马尔科夫模型描述的问题都可以用它来解码，包括今天的数字通信，语音识别，拼音转汉字，分词等。算法基础： 1、如阅读全文

posted @ 2018-01-22 09:16 quietwalk 阅读(1082) 评论(0) 推荐(0)

2018年1月17日

相关性的显著性检验

摘要：对计算好的相关系数进行显著性检验。原假设：变量间不相关，即总体的相关系数为0。 cor.test()对单个的 Pearson、Spearman 和 Kendall 相关系数进行检验。、格式：cor.test（x, y, alternative=, method=） x,y：为要检验相关性的变量阅读全文

posted @ 2018-01-17 10:17 quietwalk 阅读(14845) 评论(0) 推荐(0)

相关性分析

摘要： 1、计算相关系数 (1) cor（）函数可以计算以下三种相关系数： (2) Pearson 极差相关系数：两个连续变量之间的线性相关程度。 (3) Spearman 等级相关系数：等级变量之间的相关程度。 (4) Kendall 等级相关系数：非参数的等级相关度量。 (5) 语法：cor(data 阅读全文

posted @ 2018-01-17 10:13 quietwalk 阅读(1149) 评论(0) 推荐(0)

2018年1月15日

Kendall's tau-b（肯德尔）等级相关系数

摘要： Kendall's tau-b（肯德尔）等级相关系数：用于反映分类变量相关性的指标，适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验；取值范围在-1-1之间，此检验适合于正方形表格；计算积距pearson相关系数，连续性变量才可采用;计算Spearman秩相关系数，适合于定阅读全文

posted @ 2018-01-15 15:14 quietwalk 阅读(19746) 评论(0) 推荐(0)

Spearman（斯皮尔曼）等级相关

摘要： Spearman相关系数又称秩相关系数，是利用两变量的秩次大小作线性相关分析，对原始变量的分布不作要求，属于非参数统计方法，适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数，但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计阅读全文

posted @ 2018-01-15 15:12 quietwalk 阅读(4822) 评论(0) 推荐(0)

Pearson（皮尔逊）相关系数

摘要： Pearson(皮尔逊)相关系数：也叫pearson积差相关系数。衡量两个连续变量之间的线性相关程度。当两个变量都是正态连续变量，而且两者之间呈线性关系时，表现这两个变量之间相关程度用积差相关系数，主要有Pearson简单相关系数。 Pearson相关系数公式如下： Pearson（皮尔逊）相关系阅读全文

posted @ 2018-01-15 14:31 quietwalk 阅读(8270) 评论(0) 推荐(0)

协方差和相关系数（剔除了两个变量量纲影响、标准化后的特殊协方差）

摘要：变异系数：CV=标准差/均值*100% 协方差：用来度量两个随机变量关系的统计量。公式简单翻译一下是：对于X,Y两个变量，每个时刻的“X值与其均值之差” 乘以 “Y值与其均值之差”得到一个乘积，再对这每时刻的乘积求和并求出均值。总结一下，如果协方差为正，说明X，Y同向变化，协方差越大说明同向程度阅读全文

posted @ 2018-01-15 13:15 quietwalk 阅读(3407) 评论(0) 推荐(0)

2018年1月12日

摘要：定义：设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布，且X1、X2相互独立，则称变量F=(X1/m)/(X2/n)所服从的分布为F分布，其中第一自由度为m,第二自由度为n.[1] F分布：设X、Y为两个独立的随机变量，X服从自由度为n的卡方分布，Y服从自由度为m的卡方分布，这两个独立的阅读全文

posted @ 2018-01-12 16:47 quietwalk 阅读(5496) 评论(0) 推荐(0)

T 分布（近似标准正态分布）

摘要： 1.1 定义定义：假设X服从标准正态分布N（0,1），Y服从卡方分布，那么的分布称为自由度为n的t分布,记为。 T分布密度函数其中，Gam(x)为伽马函数。可用于两组独立计量资料的假设检验。由于在实际工作中，往往σ（总体方差）是未知的，常用s（样本方差）作为σ总体方差的估计值，为了与u变换（正阅读全文

posted @ 2018-01-12 15:42 quietwalk 阅读(24057) 评论(0) 推荐(0)

摘要： 1.1 定义设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X12+X22+......+Xn2所服从的分布为自由度为 n 的χ2分布.[1] 卡方分布的期望E（χ2）=n，方差D(χ2)=2n。卡方分布：若n个相互独立的随机变量ξ₁、ξ₂、…… 阅读全文

posted @ 2018-01-12 15:40 quietwalk 阅读(21052) 评论(0) 推荐(0)

正态分布及标准化

摘要：【正态分布】（Normal distribution），也称“常态分布”，又名高斯分布（Gaussian distribution）正态曲线呈钟型，两头低，中间高，左右对称因其曲线呈钟形，因此人们又经常称之为钟形曲线。当μ = 0,σ = 1时的正态分布是标准正态分布。正态分布有两个参数，即期阅读全文

posted @ 2018-01-12 11:05 quietwalk 阅读(15794) 评论(0) 推荐(0)

2018年1月11日

基本统计方法的选择与应用

摘要：一、确定资料的类型：分类资料、定量资料；　选择适当的统计方法，资料不同，设计不同，采用的分析方法不同；1、计量资料的比较（比较集中趋势是否不同）：（1）两组：t检验、Wilcoxon秩和检验 … t分布（近似正态分布）：用于根据小样本来估计呈正态分布且方差未知的总体的均值。定义：假设X服从标准正阅读全文

posted @ 2018-01-11 19:27 quietwalk 阅读(12245) 评论(0) 推荐(0)

摘要： 1.1.1 上下文选择符用于选择指定祖先后代的元素。 article p {font-weight:bold;}【上面这条规则的目标是位于article 上下文中的p 元素】 1.1.1.1 子选择符> section > h2 {font-style:italic;}【选择section 标签下阅读全文

posted @ 2018-01-11 17:21 quietwalk 阅读(378) 评论(0) 推荐(0)

js 引用类型

摘要： 1.1 引用类型 1.1.1 Object类型创建 Object 实例的方法有两种：（1）使用 new 操作符： var person=new Object(); person.name="Ema"; person.age=27; （2）使用对象字面量表示法： var person={ "nam 阅读全文

posted @ 2018-01-11 17:14 quietwalk 阅读(690) 评论(0) 推荐(0)

js 内置对象

摘要： 1.1 内置对象开发人员不需要显示地实例化内置对象，因为它们已经实例化了。 Object Array String Global Math 1.1.1 Global 1.1.1.1 URI编码 //有效的 URI 中不能包含某些字符，如空格，下面这两个方法用特殊的UTF-8编码替换所有无效字符，从阅读全文

posted @ 2018-01-11 17:09 quietwalk 阅读(216) 评论(0) 推荐(0)

jquery操作select(取值，设置选中）（转）

摘要： http://www.cnblogs.com/liaojie970/p/5210541.html 比如<select class="selector"></select> 1、设置value为pxx的项选中 $(".selector").val("pxx"); 2、设置text为pxx的项选中 $( 阅读全文

posted @ 2018-01-11 12:44 quietwalk 阅读(63918) 评论(0) 推荐(0)

2018年1月10日

统计描述指标的选择与应用

摘要：一、统计描述指标的选择与应用计量资料：集中趋势与离散趋势（1）正态分布：均数标准差（2）非正态分布（偏态、不规则分布）：中位数（M），四分位数（P25、P75）无序分类资料：率、构成比二、集中趋势与离散趋势集中趋势：用平均数（指标体系）反映一组观察值的中心位置或平均水平。（1）算数均数阅读全文

posted @ 2018-01-10 17:15 quietwalk 阅读(1630) 评论(0) 推荐(0)

统计学基础——统计图

摘要：频率是就样本而言的，而概率从总体的意义上说的，频率f/n 是概率 p（A）的估计值。样本频率总是围绕概率上下波动。样本含量n越大，波动幅度越小，频率越接近概率。即试验次数越多，估计越可靠。统计描述：用统计指标、统计表、统计图等方法，对样本资料的数量特征及其分布规律进行描述。统计推断：指用样本信息阅读全文

posted @ 2018-01-10 16:11 quietwalk 阅读(4436) 评论(0) 推荐(0)

【应用】R--判断类别型属性之间是否有相关性（相互之间是否独立）

摘要：检验某学区所有在售房源中，小区与楼栋类别（低层；多层;小高层；高层）是否相关导入数据：结果如下：生成列联表（频数表）：看一下新表格：结果如下：结果如下：独立性检验 1、卡方检验：对二维表的行变量和列变量进行卡方独立性检验。卡方分布—— n个独立的标准正态分布变量的平方和服从自由度为阅读全文

posted @ 2018-01-10 14:50 quietwalk 阅读(2082) 评论(0) 推荐(0)

2018年1月9日

R 分组计算描述性统计量

摘要：统计学区内各个小区的房价均值数据格式 id|community_name|house_area|house_structure|house_total|house_avg|agency_name|house_floor_curr|house_floor_total|house_floor_type 阅读全文

posted @ 2018-01-09 19:18 quietwalk 阅读(953) 评论(0) 推荐(0)

2018年1月8日

评价数据离散度方法（转）

摘要：一组数据怎样去评价和量化它的离散度，有很多种方法：标准差极差标准差极差最直接也是最简单的方法，即最大值－最小值（也就是极差）来评价一组数据的离散度。这一方法在日常生活中最为常见，比如比赛中去掉最高最低分就是极差的具体应用。标准差离均差平方和标准差离均差平方和由于误差的不可控性，因此只由两阅读全文

posted @ 2018-01-08 17:11 quietwalk 阅读(12912) 评论(0) 推荐(1)

平均值(Mean)、方差(Variance)、标准差(Standard Deviation) （转）

摘要： http://blog.csdn.net/xidiancoder/article/details/71341345 平均值平均值的概念很简单：所有数据之和除以数据点的个数，以此表示数据集的平均大小；其数学定义为以下面10个点的CPU使用率数据为例，其平均值为17.2。 1 方差、标准差方差这一阅读全文

posted @ 2018-01-08 16:52 quietwalk 阅读(173653) 评论(1) 推荐(2)

4.3 使用 SQL 语句操作数据框

摘要：下载并安装 “sqldf” 包 library(sqldf) newData <- sqldf("select * from mtcars where carb=1 order by mpg", row.names=TRUE) row.names=TRUE将原始数据框中的行名延续到了新数据框中阅读全文

posted @ 2018-01-08 16:14 quietwalk 阅读(417) 评论(0) 推荐(0)

4.2 数据框的行、列选择

摘要： 1、列选择（1）下标方式 newData <- leadership 【, c(6:10)】选择全部行和第6到第10列；将行下标留空表示选择所有行。（2）列名集合方式 newData <- leadership【c("q1", "q2", "q3", "q4", "q5")】 2、列剔除（1 阅读全文

posted @ 2018-01-08 16:07 quietwalk 阅读(668) 评论(0) 推荐(0)

4.1 基本数据管理

摘要： 1、创建新变量方式一：常规方式，用已有变量组合新变量; 方式二：使用 attach()函数，不用再带数据框变量名; 方式三：使用 transform()函数，按需创建变量，并将其保存到数据框中 mydata<- transform(mydata, sum= x1 + x2, mean = (x1 阅读全文

posted @ 2018-01-08 15:49 quietwalk 阅读(277) 评论(0) 推荐(0)

2.2.5 因子的使用

摘要：变量分类：（1）离散型：（a）有序：如病情，表示顺序有关系，但不知道相差多少。（ b）无序：没顺序关系，如糖尿病分型。（2）连续型：同时体现顺序和数量。 factor()函数；将向量因子化，抽象成整数向量。阅读全文

posted @ 2018-01-08 15:00 quietwalk 阅读(160) 评论(0) 推荐(0)

摘要：阅读全文

posted @ 2018-01-08 14:10 quietwalk 阅读(162) 评论(0) 推荐(0)

1 R语言介绍

摘要：注释：# 赋值：<- 查看、设定当前工作目录：getwd() setwd() wd：workspace directory【setwd("c:/myproject/project1")】在独立的目录中保存项目是个好主意。文本输出：函数 skin("fileName")将输出重定向到文件中。不加阅读全文

posted @ 2018-01-08 14:00 quietwalk 阅读(374) 评论(0) 推荐(0)