摘要:
首先导入数据,将数据分为训练集和测试集: import pandas as pd # Load data melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv' melbourne_data = pd.rea 阅读全文
摘要:
本文翻译自kaggle learn,也就是kaggle官方最快入门kaggle竞赛的教程,强调python编程实践和数学思想(而没有涉及数学细节),笔者在不影响算法和程序理解的基础上删除了一些不必要的废话,毕竟英文有的时候比较啰嗦。 一.什么是过拟合和欠拟合? 过拟合的含义就是当前模型十分符合训练集 阅读全文
摘要:
本文翻译自kaggle learn,也就是kaggle官方最快入门kaggle竞赛的教程,强调python编程实践和数学思想(而没有涉及数学细节),笔者在不影响算法和程序理解的基础上删除了一些不必要的废话,英文有的时候比较啰嗦。 一.什么是模型验证 模型验证在机器学习当中非常重要,因为有的时候拟合出 阅读全文