摘要:
交叉验证(Cross Validation) 在机器学习中,通常不能将全部数据用于模型训练,否则将没有数据集可以用来评估模型。 The Validation Set Approach 定义 将数据集划分成训练集(Training Set)和测试集(Test Set)两部分。 缺点 这种方法的缺点是依 阅读全文
摘要:
欠拟合(Underfitting) 定义 Bias较大、Variance较小。 如果模型在训练集上的误差很大,则此时Bias是大的,情况为欠拟合。 Bias大时如何处理 使用更复杂的模型,比如添加考虑更多维度的输入、把线性模型换成非线性模型。 过拟合(Overfitting) 定义 Bias较小、V 阅读全文
摘要:
模型选择(How to select model) 模型越复杂,一般其在训练集上的误差(Error)越小。 因为更复杂的模型(函数集)包含了更多的函数。比如二次模型包含了线性(一次)模型。 模型越复杂,其在测试集上的误差(Error)不一定越小。 因为模型过于复杂时,越容易被数据影响,可能导致过拟合 阅读全文
摘要:
回归模型应用案例(Regression Cases) 股票市场预测(Stock Market Forecast) 预测某个公司明天的股票情况 自动驾驶车(Self-Driving Car) 预测方向盘转动角度 推荐系统(Recommendation) 预测某用户购买某商品的可能性 线性回归模型(Li 阅读全文