我准备在博客园这个平台上写一些简单的介绍统计知识的文章,与大家一起讨论和学习。每一个问题我都准备分2~3讲来介绍,首先是用纯白话文来介绍基本思想(无任何公式),然后会适当做一些纯数学上的推导和讨论,最后会配合matlab讲一下它们的应用。如今,数据挖掘和机器学习是非常热门的,我也会尽量把统计知识与它们之间的联系和应用讲一下。在下学识疏浅,不足之处望多指教。

Q&A:

Q:为什么准备写这个系列的文章?

A:我觉得在大数据时代懂一些基本的统计方法还是很有必要的,一些程序猿可能没有专门学过这方面的东西,所以我想写些东西就当做基础的入门读物吧~~~

Q:为什么要用matlab?

A:当然你也可以用spss/sas这种纯统计软件,有时间学习R语言也益处多多。这里用matlab主要是为了更综合的应用,也有不少人不是玩统计的,可能matlab比那些软件更加熟悉。

Q:系列文章的计划是怎么样的?

A:我的初步计划是这样的:

第一部分是多元统计分析部分,主要包含:主成分分析,因子分析,聚类分析,判别分析,相关分析,方差分析

第二部分是计量,主要包含:线性最小二乘估计,极大似然估计,Logistic回归,偏最小二乘回归分析,面板回归

第三部分是时间序列部分,主要包含:基本过程(ar/ma/arma/arima),时间数据的调整(bp、季节),kalman滤波,谱分析,Garch

第四部分是其他,主要包含:核函数,布朗运动,随机微分,markov,monte-carlo方法,bayes方法。

———————————————————————————————————————————————————————————

写的时候可能不会完全按照上面的顺序,我会把文章的汇总链接贴在后面:

1、主成分分析的思想 http://www.cnblogs.com/wl142857/p/3217989.html

2、主成分分析的推导与应用 http://www.cnblogs.com/wl142857/p/3220421.html

posted on 2013-07-27 23:03  uumonkey  阅读(1056)  评论(5编辑  收藏  举报