01 2020 档案
摘要:为机器学习准备数据 下面我们开始为机器学习算法准备数据,首先我们将训练集中的 label(也就是median_house_value)分出来: housing = strat_train_set.drop('median_house_value', axis=1) housing_labels =
阅读全文
摘要:探索并可视化数据 到目前为止我们已经大致浏览了数据集,我们下一步的目标是更深入的了解数据集。 首先,我们要将测试集放在一边,确保我们仅浏览训练集。当然,如果训练集特别大的话,我们可能需要对它进行采样,获取它的一个小样本集进行研究。在我们的这个例子中,这个数据集非常小,所以我们可以直接在整个训练集上进
阅读全文
摘要:机器学习项目流程 在这我们会从头开始做一个机器学习项目,向大家展示一个机器学习项目的一个基本流程与方法。一个机器学习主要分为以下几个步骤: 从整体上了解项目 获取数据 发现并可视化数据,以深入了解数据 为机器学习算法准备数据 选择模型并训练 模型调优 展示解决方案 部署、监控、以及维护我们的系统 我
阅读全文