2013年3月13日

最大公因式

摘要: 欧几里得算法的数学原理 阅读全文

posted @ 2013-03-13 14:16 半个馒头 阅读(1690) 评论(0) 推荐(0) 编辑

2013年1月29日

批量读入一个文件夹中文件的数据操作实例

摘要: 批量处理数据 阅读全文

posted @ 2013-01-29 11:51 半个馒头 阅读(332) 评论(0) 推荐(0) 编辑

2013年1月7日

分类和聚类(Machine Learning Algorithm)

摘要: 分类: 分类(classification),对于一个分类员来说,通常需要你告诉它“这个东西被分为某某类”,理想情况下,一个分类员会从它得到的训练集何总进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做supervised learning(监督学习)。 聚类: 聚类(clustering),简单的说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起,因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了(距离矩阵),因此clustering通常并不需要使用训练数据进行学习,这在Machine Learning中被称作unsupervised learning(无监督学习)。 阅读全文

posted @ 2013-01-07 21:26 半个馒头 阅读(3607) 评论(0) 推荐(0) 编辑

2013年1月4日

极大似然估计

摘要: 极大似然估计要解决的问题:已知一个含有未知参数的总体分布以及总体的一部分样本数据,如何根据样本确定未知参数。MLM是根据极大似然原理的基础上的一种统计方法,确定的参数将使得所有参数控制的模型对已知的样本数据概率最大。举例说明: Example 1:一个城里人和一个知名猎人一起外出打猎,一只野兔从前方窜过,只听见一声枪响,野兔应声倒下。如果让你推测,这一发命中的子弹是谁打的?你会想,只一发命中,由于猎人命中的概率要远大于这个城里人,这一枪应该是猎人打的。 Example 2:有一个罐子,里面装着黑白两色球,黑球比白球多,你伸手取出一球,问是黑球还是白球? 阅读全文

posted @ 2013-01-04 19:38 半个馒头 阅读(482) 评论(1) 推荐(1) 编辑

2012年12月31日

R:分组数据的图形概括

摘要: 分组数据可视为特殊的多组数据,区别是:在多组数据中各数值型变量的观测值指向不同的对象,而分组数据是指同一个数值型变量的观测值按另一个变量分成若干子集,这些子集指向同一个变量。下面通过DAAG中的数据集cuckoos来看一下分组数据的特殊图形描述方法。 阅读全文

posted @ 2012-12-31 09:29 半个馒头 阅读(2099) 评论(0) 推荐(0) 编辑

2012年12月30日

R作图 等高线、三维透视图和数据变换图

摘要: 时候数据太多太集中,散点图上的信息不容易看出来,最好借助于二维的密度估计来认识图形。。首先使用MASS程序包中的二维核密度函数kde2d()来估计二维数据的密度函数,再利用函数contour()画出密度的等高线曲线图,或者用三维透视图(persp).当直接用原来的数据有时候很难得到有意义的图形事,可以对数值进行变换以得到意义的图形,最常用的是对数变换、指数变换和更为一般的Box-Cox变换。 阅读全文

posted @ 2012-12-30 14:08 半个馒头 阅读(10297) 评论(4) 推荐(1) 编辑

R:正态性检验

摘要: 功能和原理:检验样本的概率分布是否服从某种理论分布。 阅读全文

posted @ 2012-12-30 13:21 半个馒头 阅读(4625) 评论(0) 推荐(0) 编辑

概率图分布和QQ图分布的对比

只有注册用户登录后才能阅读该文。 阅读全文

posted @ 2012-12-30 12:26 半个馒头 阅读(15) 评论(1) 推荐(0) 编辑

2012年12月28日

单组数据的图形描述

摘要: 单组数据的分布可以通过直方图、茎叶图和框须图考察。后面是一个例子说明。 阅读全文

posted @ 2012-12-28 09:19 半个馒头 阅读(754) 评论(0) 推荐(0) 编辑

2012年12月27日

R作图 Binomial Distribution(±)

摘要: 正负二项分布的作图以及参数的意义观察。可以试着把两个放一块。 阅读全文

posted @ 2012-12-27 09:23 半个馒头 阅读(3804) 评论(0) 推荐(0) 编辑

导航