我准备在博客园这个平台上写一些简单的介绍统计知识的文章,与大家一起讨论和学习。每一个问题我都准备分2~3讲来介绍,首先是用纯白话文来介绍基本思想(无任何公式),然后会适当做一些纯数学上的推导和讨论,最后会配合matlab讲一下它们的应用。如今,数据挖掘和机器学习是非常热门的,我也会尽量把统计知识与它们之间的联系和应用讲一下。在下学识疏浅,不足之处望多指教。
Q&A:
Q:为什么准备写这个系列的文章?
A:我觉得在大数据时代懂一些基本的统计方法还是很有必要的,一些程序猿可能没有专门学过这方面的东西,所以我想写些东西就当做基础的入门读物吧~~~
Q:为什么要用matlab?
A:当然你也可以用spss/sas这种纯统计软件,有时间学习R语言也益处多多。这里用matlab主要是为了更综合的应用,也有不少人不是玩统计的,可能matlab比那些软件更加熟悉。
Q:系列文章的计划是怎么样的?
A:我的初步计划是这样的:
第一部分是多元统计分析部分,主要包含:主成分分析,因子分析,聚类分析,判别分析,相关分析,方差分析
第二部分是计量,主要包含:线性最小二乘估计,极大似然估计,Logistic回归,偏最小二乘回归分析,面板回归
第三部分是时间序列部分,主要包含:基本过程(ar/ma/arma/arima),时间数据的调整(bp、季节),kalman滤波,谱分析,Garch
第四部分是其他,主要包含:核函数,布朗运动,随机微分,markov,monte-carlo方法,bayes方法。
———————————————————————————————————————————————————————————
写的时候可能不会完全按照上面的顺序,我会把文章的汇总链接贴在后面:
1、主成分分析的思想 http://www.cnblogs.com/wl142857/p/3217989.html
2、主成分分析的推导与应用 http://www.cnblogs.com/wl142857/p/3220421.html