软工实践第二次作业
学期规划
数据挖掘介绍
现在是大数据时代,网络上有大量数据等待挖掘,人们如何在海量的数据中找到自己想要的数据,数据挖掘应运而生。数据挖掘工程师通过算法从大量数据中搜索隐藏在其中的所需数据,这些数据可用使企业决策智能化,自动化,从而使企业提高工作效率,减少错误决策的可能性,以在激烈的竞争中处于优势地位。
学习计划
第一个月,我通过虚拟社区的发现与演化的阅读对社区有个大概的了解,然后动手实现一个社区发现算法,并用ppt的形式描述这个算法,寻找导师答辩,答辩现场将算法现场演示。
第二,三个月,进行python和Java的学习,尝试用python语言和Java语言实现一个社区发现算法。
第四个月,通过对于概率论,线性代数,凸优化等数学基础的学习后,对算法的原理有一个更深入的理解,尝试对算法进行改进。
第五个月,阅读并行计算方面的书籍。1,hadoop权威指南第三版2,数据算法:hadoop/spark大数据处理技巧3,spark快速大数据分析。
我认为这个计划时间安排可能会过于紧凑,实践过程中需要根据实际学习进度动态调整。