随笔分类 - 机器学习
摘要:应用机器学习的时候,会遇到很多问题。比如模型的选择,数据的拟合程度,新样本的泛化程度。这里记录 一些相关概念和应对方法。 1. 将 数据集分成 训练集,验证集,测试集。最好是采用随机方法来取,一般是 60% ,20%,20%。 要考虑假设函数的拟合程度(也就是模型选择)以及 新情况的泛化程度,验证集
阅读全文
摘要:线性回归之梯度下降算法 https://zhuanlan.zhihu.com/p/58182806
阅读全文
摘要:前面说了针对 代价函数 ,为了找到使得代价函数最小的参数值,常常使用梯度下降算发,经过多次迭代找到参数值,但是多次迭代会消耗一些时间,所以就提出了另外一种方法,正规方程法 正规方程 不需要迭代一次就能求出参数,但是特征数超过10000,就要谨慎使用,矩阵会太大,反而消耗更多时间。 这里的参数是一个向
阅读全文