摘要: 这一篇讲的是区间估计…..因为这不是一个关于统计学的系列,所以对文中出现的公式不会给予任何证明…..就是这样。就从一个最简单的正态分布的方差已知时,求均值的置信区间开始吧。书上的公式告诉我们这个区间是 $\overline{x}\pm(\sigma/\sqrt{n})z_{1-\sigma/2}$,... 阅读全文
posted @ 2012-06-30 22:31 罗刹剑客 阅读(14550) 评论(0) 推荐(0) 编辑
摘要: 一元线形回归模型:有变量x,y。假设有关系y=c+bx+e,其中c+bx 是y随x变化的部分,e是随机误差。 可以很容易的用函数lm()求出回归参数b,c并作相应的假设检验,如:x|t|)(Intercept) 28.493 1.580 18.04 5.88e-09 ***x 130.835 9.... 阅读全文
posted @ 2012-06-30 22:21 罗刹剑客 阅读(45741) 评论(0) 推荐(0) 编辑
摘要: 不同于之前的分类和聚类算法,优化的目的是尝试找到一个使成本函数输出最小化的值。这里主要包括两个算法:模拟退火算法和遗传算法。成本函数:接受一个经推测的题解,并返回一个数值结果,该值越大代表成本越高(题解表现越差),该值越小就表示题解越好。模拟退火算法:优化算法的目标可以看为寻找x使函数f(x)最小。... 阅读全文
posted @ 2009-09-30 21:50 罗刹剑客 阅读(636) 评论(0) 推荐(0) 编辑
摘要: 数学基础:线性代数的矩阵乘法运算。 非负矩阵分解是一种特征提取的算法,它尝试从数据集中寻找新的数据行,将这些新找到的数据行加以组合,就可以重新构造出数据集。算法要求输入多个样本数据,每个样本数据都是一个m维数值向量,首先把我们的数据集用矩阵的形式写出来,每一列是一个数据,而每一行是这些数据对应维度的... 阅读全文
posted @ 2009-09-25 20:09 罗刹剑客 阅读(2663) 评论(0) 推荐(0) 编辑
摘要: 一直没有时间写…..唉这个东西好像是属于数据可视化?反正就是把多维的数据降到低维空间但是仍然尽可能的保持原来数据之间的距离关系(就是在原来维度下离的远的点仍然离得远,接近的点仍然接近) 。最常见的应该就是降到2维以方便打印和屏幕输出。算法的输入是所有数据在高维情况下两两之间的距离(记i与j的距离为D... 阅读全文
posted @ 2009-09-21 00:40 罗刹剑客 阅读(1789) 评论(0) 推荐(0) 编辑
摘要: 因为这两个算法比较简单,又有些相似,所以这里放在一起。K-最近邻:k-最近邻也是一种用来进行预测的算法。工作原理:接受一个用以进行数值预测的新数据项,然后将它与一组已经赋过值的数据项进行比较。算法会从中找出与待预测数据最为接近的k项,并这k项其求均值以得到最终的结果。总计来说这是一个很简单的算法,只... 阅读全文
posted @ 2009-09-14 11:40 罗刹剑客 阅读(2702) 评论(0) 推荐(0) 编辑
摘要: 今天上了开学的第一节统计学,开了很久的小差,想了不少东西。 以前虽然自学过概率论与数理统计,但是也只是了解了一些公式与原理,一直对于统计学的一些应用不甚理解(或者说不能接受),尤其是基于统计的机器学习,一直不能接受它作为一种实现的人工智能的手段。因为我心中的人工智能是绝对理性,严谨,逻辑的。虽然... 阅读全文
posted @ 2009-09-11 00:20 罗刹剑客 阅读(547) 评论(0) 推荐(0) 编辑
摘要: 支持向量机……复杂的东西,书里讲得也不怎么详细,起码具体算法没有说……所以又去查了些资料……支持向量机是用来对数据进行分类的。首先从最简单的情况开始吧:如果有一条直线,我们把它看成一条数轴,上面有一些样本点,其中坐标大于某个值的点都属于一类,坐标小于某个值的点都属于一类,那么我们就可以用这个值来做分... 阅读全文
posted @ 2009-09-08 12:45 罗刹剑客 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 生物神经网络: 在生物的神经网络中的基本单位是神经元,神经元与神经元之间是由突触的相互联系来传递信息的,在静止息状态时,神经元的膜的内外电压保持一种稳定状态(膜内电压低于膜外电压),当神经元受到刺激后,在被刺激的部分周围,这种平衡状态会被打破,电压改变,与没有受到刺激的部分形成电流传递信息,电流的强... 阅读全文
posted @ 2009-09-07 16:25 罗刹剑客 阅读(2201) 评论(0) 推荐(0) 编辑
摘要: 数学基础:树:树是一种数据结构,它是由n(n>=1)个有限结点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:每个结点有零个或多个子结点;每一个子结点只有一个父结点;没有前驱的结点为根结点;除了根结点外,每个子结点可以分为m个... 阅读全文
posted @ 2009-09-06 21:27 罗刹剑客 阅读(3038) 评论(0) 推荐(0) 编辑