大数据应用技术课程实践--选题与实践方案

一、选题与意义

1.Hadoop平台应用

2.Kaggle分析数据项目

简要说明理由与意义。

选择第二题。原因是:kaggle作为数据科学的家园,它提供的竞赛不仅让我从不同的高度思考问题,还借用奖金来吸引有更多有能力的人加入,初学者如我也可以从中学习优秀者的理论经验,从而提升自身能力。

二、实践方案

简要说明理由。

 在kaggle中获取pronto公司共享的数据,通过给予的历史数据(包括天气、时间、季节等特征)预测特定条件下的租车数目。通过选择决策树、SVM(支持向量机)和随机森林算法,构建不同的模型。在特征过程后,使用训练数据集对模型行进行训练。最终使用训练好的模型对测试集进行预测。

三、实践任务分解

根据所选的题目,明确实验步骤,分解任务到每天。

四、实践计划

按任务分解撰写计划表,每天按计划表开展工作。

第天根据实际情况更新计划表,有必要时调整。

 

1.

2.

https://www.kaggle.com/competitions

 

说明:

  • 个人项目,不要求组队,确实需要组队的说明理由。
  • 边操作边记录;
  • 每天完成当天文档;
  • 最后综合成课程实践报告。
posted @ 2020-06-23 16:21  酒大暗  阅读(243)  评论(0编辑  收藏  举报