2013年10月30日
摘要: 1. 概览 偏最小二乘算法,因其仅仅利用数据X和Y中部分信息(partial information)来建模,所以得此名字。其总体处理框架体现在下面两图中。 建议先看第2部分,对pls算法有初步了解后再看此框架,会有更全面深入的体会。 得到 阅读全文
posted @ 2013-10-30 10:04 Tony Ma 阅读(2458) 评论(0) 推荐(1) 编辑
摘要: 1 NIPALS 算法 Step1:对原始数据X和Y进行中心化,得到X0和Y0。从Y0中选择一列作为u1,一般选择方差最大的那一列。 注:这是为了后面计算方便,如计算协方差时,对于标准化后的数据,其样本协方差为cov(X,Y)=XTY/(n-1)。 Step2:迭代求解X与Y的变换权重(w1,c1)、因子(u1,t1),直到收敛 step 2.1:利用Y的信息U1,求X的... 阅读全文
posted @ 2013-10-30 10:02 Tony Ma 阅读(20048) 评论(2) 推荐(3) 编辑
  2013年5月23日
摘要: 转自:Dahua的博客http://dahuasky.wordpress.com/2008/10/02/%e6%97%a0%e5%a4%84%e4%b8%8d%e5%9c%a8%e7%9a%84%e7%ba%bf%e6%80%a7%e5%88%86%e8%a7%a3/ 深刻的思想往往蕴含在简单的数学形式之中。从小至今,对数学的学习一直不断,所学愈多,愈深感现代数学之博大,自己根基之薄弱。在自己所... 阅读全文
posted @ 2013-05-23 14:08 Tony Ma 阅读(1222) 评论(0) 推荐(0) 编辑
摘要: 以下资料来自Dahua的博客,非常可惜后来该博客关闭了。 在过去的一年中,我一直在数学的海洋中游荡,research进展不多,对于数学世界的阅历算是有了一些长进。 为什么要深入数学的世界 作为计算机的学生,我没有任何企图要成为一个数学家。我学习数学的目的,是要想爬上巨人的肩膀,希望站在更高的高度,能把我自己研究的东西看得更深广一些。说起来,我在刚来这个学校的时候,并没有预料到我将会有一... 阅读全文
posted @ 2013-05-23 13:58 Tony Ma 阅读(585) 评论(0) 推荐(0) 编辑
摘要: 以下资料来自Dahua的博客,非常可惜后来该博客关闭了。 前一段时间,随着研究课题的深入,逐步研习现代概率理论,这是一个令人耳目一新的世界。这个世界实在太博大,我自己也在不断学习之中。这篇就算起一个头吧,后面有空的时候还会陆续写一些文章和大家分享我在学习过程中的思考。 概率论要解决的问题 概率论是很古老的数学分支了——探讨的是不确定的问题,就是说,一件事情可能发生,也可能不发生。然后,... 阅读全文
posted @ 2013-05-23 13:56 Tony Ma 阅读(837) 评论(0) 推荐(0) 编辑
摘要: 以下资料最初应该来自Dahua的博客,非常可惜后来该博客关闭了,特从此处转载:http://blog.sina.com.cn/s/blog_6833a4df0100nazk.html 感觉数学似乎总是不够的。这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书。从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learn... 阅读全文
posted @ 2013-05-23 13:54 Tony Ma 阅读(397) 评论(0) 推荐(0) 编辑
摘要: 以下资料最初应该来自Dahua的博客,非常可惜后来该博客关闭了,特从此处转载:http://blog.sina.com.cn/s/blog_6833a4df0100nazk.html 1. 线性代数 (Linear Algebra): 我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年... 阅读全文
posted @ 2013-05-23 13:51 Tony Ma 阅读(466) 评论(0) 推荐(0) 编辑
摘要: 以下资料最初应该来自Dahua的博客,非常可惜后来该博客关闭了,特从此处转载:http://blog.sina.com.cn/s/blog_6833a4df0100nazk.html Learning是一个融会多种数学于一体的领域。说起与此有关的数学学科,我们可能会迅速联想到线性代数以及建立在向量空间基础上的统计模型——事实上,主流的论文中确实在很大程度上基于它们。 R^n (n-维实向... 阅读全文
posted @ 2013-05-23 13:46 Tony Ma 阅读(548) 评论(0) 推荐(0) 编辑
  2011年11月21日
摘要: 尽管高斯消元法是解线性方程组的标准算法,但是当我们希望从数据中将重要信息与次要信息(噪声)分离时它就无能无力的。在线性代数中,我们要量化“好的与坏的基向量(basis vectors)。不严格的说,好的基向量是那些基本线性独立的向量,接近于正交。下面,就来领略如何利用正交向量进行计算。 在前面介绍最小二乘问题时,了解当选择了不恰当的基向量时会导致病态的正规方程。下面看个例子,两个非常相似的... 阅读全文
posted @ 2011-11-21 15:42 Tony Ma 阅读(708) 评论(0) 推荐(0) 编辑
摘要: 1. 病态系统 系统的精确解为x=1,y=-1。若对b2=0.067进行轻微的扰动变为0.066,那么精确解变为x=-666,y=834。这个例子深刻说明了病态系统(ill-conditioned systems)的解对于小扰动非常敏感。而这种敏感是由于系统的内在特征,而不是数值求解的结果。这是没有任何数值求解的技巧可有消除这种敏感性。 对于2*2的系统,这种情况可以用图形来清晰说明。两... 阅读全文
posted @ 2011-11-21 15:29 Tony Ma 阅读(4471) 评论(0) 推荐(0) 编辑