美赛小知识
(一) 数据处理
① 插值拟合
主要用于对数据的补全和基本的趋势分析
② 小波分析,聚类分析(高斯混合聚类,K-均值聚类等等)
主要用于诊断数据异常值并进行剔除
③ 主成成分分析、线性判别分析、局部保留投影等
主要用于多维数据的降维处理,减少数据冗余
④ 均值、方差分析、协方差分析等统计方法
主要用于数据的截取或者特征选择
(二) 关联与因果
① 灰色关联分析法(样本点的个数较少)
② Superman或kendall等级相关分析
③ Person相关(样本点的个数比较多)
④ Copula相关(比较难,金融数学,概率密度)
⑤ 典型相关分析(因变量Y1234,自变量组X1234,各自变量组相关性比较强,问哪一个因变量与哪一个自变量关系比较紧密?)
(三) 分类与判别
① 距离聚类(系统聚类)常用
② 关联性聚类(常用)
③ 层次聚类
④ 密度聚类
⑤ 其他聚类
⑥ 贝叶斯判别(统计判别方法)
⑦ 费舍尔判别(训练的样本比较少)
⑧ 模糊识别(分好类的数据点比较少)
(四) 评价与决策
① 模糊综合评判:评价一个对象优、良、中、差等层次评价,评价一个学校等,不能排序。
② 主成成分分析:评价多个对象水平并排序,指标间关联性很强。
③ 层次分析法:做决策,通过指标,综合考虑做决定
④ 数据包络(DEA)分析法:优化问题,对各省发展状况进行评判
⑤ 秩和比综合评价法:评价各个对象并排序,指标间关联性不强
⑥ 神经网络评价:适用于多指标非线性关系明确的评价
⑦ 优劣解距离法(TOPSIS法)
⑧ 投影寻踪综合评价法:糅合多种算法,比如遗传算法、最优化理论
⑨ 方差分析、协方差分析等
方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的量有无影响,差异量的多少;(92年作物生长的施肥问题)
协方差分析:有几个因素,我们只考虑一份因素对问题的影响,忽略其他因素,但注意初始数据的量纲以及初始情况。(06年,艾滋病疗法的评价以及预测问题)
(五) 预测与预报
① 小样本内部预测
② 大样本内部预测
③ 小样本的未来预测
④ 大样本的随机因素或周期特征的未来预测
⑤ 大样本的未来预测
灰色预测模型(必须掌握)
满足两个条件可用:
- a数据样本点个数少,6-15个
- b数据呈现指数或曲线的形式
微分方程预测(备用)
无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据之间的关系
回归分析预测(必须掌握)
求一个因变量与若干自变量之间的关系,若自变量变化之后,求因变量如何变化
样本点的个数有要求
- a自变量之间协方差比较小,最好趋于0,自变量间的关系小;
- b样本点的个数n>3k+1,k为自变量的个数;
- c因变量要符合正态分布
(六) 优化与控制
① 线性规划、整数规划、0-1规划(有约束,确定的目标)
② 非线性规划与智能优化算法
③ 多目标规划和目标规划(柔性约束,目标含糊,超过)
④ 动态规划
⑤ 图论、网络优化(多因素交错复杂)
⑥ 排队论与计算机仿真
⑦ 模糊规划(范围约束)
⑧ 灰色规划(难)