机器学习基本概念
1. 统计学习 是计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科;
2. 统计学习的方法: 监督学习,无监督学习,半监督学习和强化学习
3. 监督学习: 学习出一个模型,使模型能够对任意给定的输入,输出一个预测。利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练。监督学习中在给予计算机学习样本的同时,还告诉计算各个样本所属的类别。 分类, (query分类,query意图识别。近义词、关联词)
4. 无监督学习:不对数据进行标明,让机器自动去判断,哪些数据比较像,归到一类等等。聚类, (近义词、关联词,聚类)
5.半监督学习:半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
所给的数据有的是有标签的,而有的是没有标签的。
6.强化学习:
7. 特征向量: 矩阵A的特征值和特征向量分别为和x,记为,该式子可理解为向量x在几何空间中经过矩阵A的变换后得到向量。由此可知,向量x经过矩阵A变换后,方向并无改变(反方向不算方向改变),只是伸缩了倍