课堂测试——机器学习原理

1、用自己的话说明机器学习的四大分类: classification (分类)clustering (聚类)regression (回归)dimensionality reduction (降维)

classification (分类):分类需要先找到数据样本点中的分界线,再根据分界线对新数据进行分类,分类数据是离散的值,比如图片识别、情感分析等领域会经常用到分类任务。

clustering (聚类)聚类是根据样本之间的相似度,将一批数据划分为N个组。比如用户分组、异常值检测等领域会用到聚类任务。 

regression (回归):回归是对已有的数据样本点进行拟合,再根据拟合出来的函数,对未来进行预测。回归数据是连续的值,比如商品价格走势的预测就是回归任务。 

dimensionality reduction (降维):降维是减少数据的维度,对数据进行降噪、去冗余,方便计算和训练;如数据预处理,减少一些对模型准确率影响很小维度,可以提高计算效率。再如图表可视化,我们进行数据分析时,通常会将高维模型降为三维或二维图表,便于直观分析。 

 

2、用自己的话说明正向传播、反向传播、梯度下降。

正向传播:正向传播是指对神经网络沿着从输入层到输出层的顺序,依次计算并存储模型的中间变量。

反向传播:反向传播用于计算神经网络中的参数梯度。

梯度下降:用于优化目标函数,如果要最小化一个损失函数,就使用梯度下降法。

 

3、用自己的话说明梯度消失和梯度爆炸原因。

(1)隐藏层的层数过多;(2)采用了不合适的激活函数;(3)权重的初始化值过大.

posted @ 2021-03-25 17:27  Spongbob  阅读(59)  评论(0编辑  收藏  举报