第三次作业——团队介绍及选题背景与意义
团队作业之一:团队介绍及选题背景与意义
团队介绍及组员情况
1、队名:鱼与绿鲤鱼与红鲤鱼与驴与鲤鱼
2、团队成员:
班级 |
姓名 |
组员身份 |
计算1511 |
刘涛 |
队长 |
计算1511 |
纪芳 |
组员 |
计算1513 |
张泽政 |
组员 |
计算1513 |
林瑞溶 |
组员 |
计算1513 |
廖文静 |
组员 |
计算1513 |
林光涵 |
组员 |
3、组员情况:
利用RASCI模型进行分析:
分工 |
负责人 |
主要介绍 |
图解 |
R(Responsible):负责把具体事情做好,具体负责操控项目、解决问题。 |
张泽政 |
责任意识较强,对待自己的任务尽可能全面、细致的完成,曾参加过ACM-ICPC国际大学生程序设计竞赛,数学建模国赛,创新创业比赛。喜欢研究算法,在本次项目中对各个项目的模块(后台逻辑、前台页面形式)进行协调和沟通,在一定程度上指点、提出建议。并负责本次使用的轻量级数据库的维护。
|
|
A(Accountable):对任务负全责,有批准的权利。 |
刘涛 |
学能力强,办事效率高,曾参加全国大学生数学建模国赛并取得国家二等奖,院人工智能协会骨干,参加过全国各类人工智能大赛并取得过优异成绩,在机器学习、数据分析、人工智能方面颇有建树,在本项目中负责神经网络模型的搭建和训练,在关键节点负责决策。
|
|
S(Suppor): 对任务提供支持,辅助完成任务。 |
林瑞溶、林光涵。
|
林瑞溶:学习能力较强,曾参加过开源创客竞赛、全国大学生数学建模竞赛等学科竞赛,工作细致认真,各个方面(如绘图、撰文、编程、建模)方面均有较好的能力,同时协调能力较强,与团队积极沟通,辅助前台、后台的搭建,以及审核神经网络模型的训练结果。 林光涵:学习积极性高,对自己感兴趣的东西常常钻研一些额外的东西,在前台搭建方面能力很强,在后台逻辑编写方面思路也很清晰,编程时注重整体格局,因此常常编写出效果较好的程序,在本次项目中负责部分前台编写、后台设计以及分析数据可视化。 |
|
C(Consulted): 咨询,拥有完后项目所需的信息或者能力的角色。
|
纪芳
|
学习成绩优异,工作能力卓著,在班级上担任过不同的班委,多次参与学院各科研立项,主要在其中负责信息收集(如搜索项目相关资料并进行整理),以及前台页面的设计,在本次项目中是前台页面编写的主力,由于具有丰富的前台页面编写经验,所以常常能写出一些视觉效果不错的页面。
|
|
I(Informed): 知会者,应该事后及时通知结果的角色。 |
廖文静 |
低调的女生,心思缜密,常常能想到一些别人会忽略的细节,因此在本次项目中主要对各个模块的结果进行评价和分析,及时发现漏洞,并通知各个模块负责人进行修改。除此之外,她还与纪芳一起负责前台页面的编写,女生的审美能力一般较强,所以能编写出友好的前台页面。
|
|
4、组队原因:
① 个人原因 —— 队伍里的成员互相之间都比较熟悉,私下关系比较好。除此之外在以往的一些项目、比赛乃至课程设计中有过合作的经历,有一定的合作默契,相信对于项目的完成可以有很大的帮助。
② 能力原因 —— 小组的每一位成员都是认真、负责的人,对自己该完成的任务不会拖拉,在实现能力方面,也都有一定的基础和功底,参加过许多项目有一定的经验。
③ 兴趣原因 —— 在本项目中具有一致的学习目标,我们团队林光涵、林瑞溶同学对学习Python语言很感兴趣,而张泽政和刘涛则想借此机会结合具体样例研究一下数据挖掘算法以及机器学习领域的知识。纪芳、廖文静则可以借此机会增长自己的前台页面编写能力和经验,毕竟众所周知的是前台页面的编写水平与工作经验息息相关。
综合上述原因,我们组成了这样一支6人小组,在项目的各个方面都有具体的人负责具体的工作,整体协调起来比较轻松,每个人都能学习到自己感兴趣的知识。
一、选题的背景与意义
1、选题名称:
基于神经网络模型的学习行为分析平台。
2、选题背景:
当前国家强调大众创新,全面创业,根据近几年的政策和专业发展趋势,我们发现“大数据”、“人工智能”这两个方向是当前最炙手可热的研究方向。但是我们目前学了什么呢(在这里只列举对实现一个项目有帮助的):
① 数据库原理——可以帮助我们构建数据库
② 企业分布式计算(J2EE)——可以帮我们实现WEB平台
③ JAVA ——提供面向对象思想
④ 数据结构——提供算法基础和优化思想
⑤ JavaScript+Css5+HTML —— 前台页面编写
作为计算机专业的学生,我们自然都各有所长,也有自己课外的研究方向,至此,我们又具备以下能力:
① 机器学习算法:刘涛是人工智能协会的核心骨干之一,他在课余刷过很多这方面的题,也看过很多这方面的论文,经常给对该领域感兴趣的学弟学妹讲课。
② 编程、优化算法:ACM-ICPC是非常注重程序编写的效率的,比如字典树、线段树其实都是应用在复杂度优化方面的,张泽政参加过ACM-ICPC国际程序设计竞赛,并在课余积极训练,所以在这方面具有一定能力。
③ Python语言编写后台:众所周知,python强大之处就是其应用的广泛,林光涵、林瑞溶曾自学过这方面的知识,并参与过学院组织的一些项目,但希望在本项目的完成中得到进阶。
④ 数据库搭建技术、轻量级数据库:虽然我们学习的是SQL SERVER数据库管理系统,但这个DBMS本身就比MY SQL复杂,很多复杂的语法MY SQL干脆就不支持,所以MY SQL这个轻量数据库就适用于那些数据库本身不复杂的项目,本项目刚好符合这一点。
本着积极学习新技术的想法,想接触一下数据分析方面的项目,并受到指导老师苏老师的启发,我们决定做学习行为分析方面的数据挖掘,同时,对于神经网络模型,刘涛同学已经多次应用过,所以在这方面问题不会太大,据此,我们想做一个基于神经网络模型的学习行为分析系统。在实现方式上,由于之前所学习WEB方面知识比较多,因此选择使用B/S模式实现。
3、选题意义:
① 通过对学生行为的分析/系统演示,并将数据通过一定处理进行图形可视化进一步得出结论,可以对教育方式、教育方法具有极大的参考价值,基于数据分析规律的精准治理,预测新时代教育方式应往哪些方面转变,新时代学生的学习方法存在哪些亟待解决的问题,存在哪些值得推行的方法。并通过学生近期状态的分析,可以及时与学生沟通,对近期状态较差的学生及时进行改造。
② 通过具体项目实例来了解大数据,应用大数据解决实际问题,这是我们学习的目的,我们组的组员都想借此机会学习当前最新的技术。
③ 作为计算机专业的大三学生,经过了前面两年的理论知识学习以及课程设计基础,我们都初步具备了完成一次项目作业的能力,迫切需要一个锻炼与检测我们动手能力的项目。本项目刚好可以满足我们这项需求。
④ 在当今创新创业时代,大数据技术、人工智能等高级技术普及度越来越高,为了跟上时代的潮流,我们理应去了解、应用这些技术。
⑤ 通过本次项目作业可能会使我们小组的凝聚力大大提升,对队友之间的默契度也有积极意义,这样很有可能我们会成为一个真正意义上的小组,这样在以后的一些比赛和项目也可以直接组成一个有高凝聚力的队伍。
二、项目综述
1、平台的核心功能:
① 数据分析、可视化
通过输入学生的日常数据,通过神经网络模型来总结该学生近期的学习状态,并通过编程来实现数据的可视化显示,以具体、形象的方式反映出学生状态,并适用于多个学生数据同时输入输出的情况,这样就可以对这些学生的学习状态进行对比。
数据分为(暂定,可能根据实际情况进行调整):在图书馆逗留时间,借书情况表,旷课/上课次数表,作业完成情况表,参加社团活动时间表,参加比赛表,起床/睡觉时间表,晚归表,自习时间表,游戏时间表。
学习状态:用图像描绘,大致分为好、较好、一般、差、较差等。
② 意见反馈:用户分析完数据后,可对其分析结果对平台提出建议,也可针对平台的各个功能进行评价和反馈,管理员收到反馈后可进行回复,这样,整个平台的运作呈良性循环。
③ 交流论坛:平台的另一核心功能,用户在这里可以畅所欲言,体验百度贴吧式的发帖功能,可对自己的分析数据进行交流和数据共享,致力于提供一个开放、和谐的交流论坛。
2、面向的用户:
面向的使用者主要为:普通用户,平台管理员。
针对普通用户:
普通用户需要注册账号(可通过手机号注册),进行登录。
在讨论区/论坛发言,上传数据/保存数据,保存自己的数据分析记录,意见反馈功能。
针对管理员用户:
管理员登录之后,可以接收用户的反馈,用户管理,论坛管理。
3、为什么要这么做:
要做大数据分析,有两个东西要做好,一个是数据的存取,一个是数据的分析。前者涉及到数据库的设计,后者涉及到算法的实现优化,除此之外最重要的就是数据的收集,这是一个棘手的问题,但我们的成员都会积极的参与数据收集。我们也是按照这些来开展我们的项目,先设计数据库,同时开始写一些前端的UI交互界面,把基本的框搭建好,预留出接口(也就是调用后台的指令),这个时候要学习使用pyhton+mysql,数据库设计之后,就要写后台,不如用python操作mysql达到增删改查的目的。最后把数据分析模块以接口的形式嵌入到整个平台。
4、Extra Introduction
a)数据的组成元素(目前设想,考虑到数据项略多,以后可能会适当缩减)
- 在图书馆逗留时间
- 借书情况表
- 旷课/上课次数表
- 作业完成情况表
- 参加社团活动时间表
- 参加比赛表
- 起床/睡觉时间表
- 晚归表
- 自习时间表
- 游戏时间表
b)数据可视化:
主要使用折线图,一定要选取绘制效果比较友好的绘制方法,以提高用户黏性。
c)数据的获取:
- 先看看网上有没有公开的数据集,如果有,使用,如果没有,用代码随机生成数据。这样做是为了解决无法获取大量数据的痛处。获取大量数据之后,我们会使用相关算法(比如神经网络算法,逻辑回归算法),并且根据这些数据获得模型。
- 用户提供数据,不断地完善模型。
d)可能面临的问题:
- 用户提供的数据不一定是“好的”,比如明显不是一个好的学习方式,但是却提供了很高的评价分数。如果使用这一部分数据继续“优化”模型,很可能导致模型越来越偏离“优秀”。
- 数据的获取问题,当前虽然搜索引擎发达,但是数据的搜集依然是一个难题,特别是本项目预想的数据项比较多,可能在这方面遇到不少困难,但与老师交流以后我们发现在这次项目中可以先绕过这个问题,我们可以自己设计数据来进行训练,毕竟我们们的短期目的是把平台设计完整,对数据分析模块的优化可以放到以后慢慢进行改进和维护。
三、NABCD模型分析产品
N(Need):
时代需求:近年来,大数据技术在互联网上飞速发展,并迅速渗透到各行各业。2012 年,联合国发布的大数据白皮书“Big Data for Development:Challenges& Opportunities”中指出,大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响。对大数据的研究和分析则非常重要。
用户需求:学习者希望提高自身学习效果,大学教育工作者希望针对学习者改进教育方式,为学习者提供个性化教学支持服务,提升学习者的能力。
项目实施人员需求:本项目的参与者均为集美大学计算机工程学院计算机科学与技术专业的学生,我们希望通过本次项目来学习新的编程语言、新的算法框架、新的应用技术。
A(Approach):
在经过小组成员积极讨论以后,综合各个成员的兴趣与特长,我们设想的实现步骤如下:
1、建立数据库,确定整个平台的主题框架。
2、Web前端交互,实现上面说的基本功能的接口。
3、用python操作mysql数据库,并且与前端的接口对接。
4、获取数据,使用与训练模型分析数据,返回结果。
B(Benefit):
1、通过对学生行为的分析/系统演示将数据进行可视化进一步得出结论,可以对教育方式、教育方法具有极大的参考价值,基于数据分析规律的精准治理,预测新时代教育方式应往哪些方面转变,新时代学生的学习方法存在哪些亟待解决的问题,存在哪些值得推行的方式。
2、通过具体项目实例来了解大数据,应用大数据解决实际问题,这正是我们学习大数据的原因,此外,我们可以在实践中不断发掘大数据的价值,不断总结大数据可能存在的问题,提高自己的专业能力和眼界。
C(Competitors):
1.国内现状 —— 国内关于学习分析技术的研究尚处于初步探索阶段,大多数研究是以文献研究、问卷调查为主,即使某些高校的研究工作者对基于数据分析的学习行为分析开展了研究,但是并不普遍。本项目力求做到数据分析结果的可视化,并力求实现使用过程的透明性,即尽可能对用户隐藏技术细节,降低产品的操作难度,以此提高产品黏性。
2.附加功能 —— 本平台也提供一个交流区,即论坛功能,本平台致力于设计出一个功能强大友好的论坛,可以为全国各地的使用者服务,让他们可以自由、公开的交流教育经验,借鉴别人的数据分析结果,从而改进自己的教育方式。
3.当前的数据分析平台(如阿里巴巴云计算、百度云计算)虽然功能强大,训练结果好,但是主要是面向开发者的,并不能面向普通用户去分析自己的数据,且收费很高,一般想测试的用户不会考虑使用这些平台,但对学习行为分析这领域当前国内还没有类似平台,所以本平台的出现无疑是对教育者、学者的福音。
D(Delivery):
1.主要宣传方式 —— 此款产品主要是为大学教育工作者而设计的,我们的产品使用范围应锁定在各个高校,因此需要进入某些高校和高校负责人进行交涉,详细解释此产品的用途和益处,让他们知道我们平台的益处,以扩大用户规模。
2.平台使用方式 —— 本平台致力于设计出界面友好、数据分析能力强大、数据分析结果可视化效果好的综合平台,还有一个完备的论坛供用户交流,但平台的页面不会设计的太复杂,方便用户的使用。