04 2022 档案
摘要:在本篇文章中,我们将按照以下流程来介绍广义线性模型。 指数族和最大熵模型 基于指数族的广义线性模型——广义线性模型的构成、极大似然估计和求解算法 广义线性模型的偏差和分析 广义线性模型的特征选择 1、指数族和最大熵模型 1.1 指数族的形式 指数族是概率统计中最重要的一类分布族。具有以下的一般形式:
阅读全文
摘要:变量选择是在面对高维数据时需要处理的问题,有三类处理的方法,分别是最优子集的搜索、变量的稀疏和压缩、降维和特征重构。 最优子集的搜索L:一类处理方法是从备选的变量集合里面筛选出对于我们的分析目的有更大贡献的子集,常用的方法由最优子集法、BIC\AIC准则选择法、随机森林等。 变量的压缩和稀疏:常用的
阅读全文
摘要:
intro 判别分析是一类监督学习,解决的是在已知标签的训练数据时,训练模型对未知标签的数据进行分类。在统计学习方法中有以下方法可以来做分析。 软分类:logistic回归、随机森林、神经网络等 硬分类:距离判别分析、贝叶斯判别分析、费希尔判别分析、支持向量机、决策树、朴素贝叶斯等 其中关于硬分类问
阅读全文

摘要:图数据(0,1板块) 目录: 0、引入 1、图数据 1.1 何为图数据 1.2 图相关的理论铺垫 1.2.1 线性代数——从矩阵的乘法到以特征向量为基的线性变换 1.2.2 谱图理论 1.3 图数据应用——谱聚类 第1板块 总结 2、图卷积神经网络综述 3、图卷积神经网络的实践 0.引入——卷积神经
阅读全文