wds1846928068

结合工程实践选题调研分析同类软件产品

我工程实践的题目是《面向大数据分析的成绩预判系统

        课题的概要可以阐述为:在日常学习过程中产生的大量数据(期中考试成绩、多次实验分数等)及相关学生的评价信息,并通过有效的数据分析技术可以对教学过程提供有益的决策支持。项目拟采用数据挖掘及机器学习等理论,通过大量的基础数据,进行期末成绩的相关预测。项目需要提出具体的模型实现方法(如决策树等),同时对模型相关属性的重要性进行了分析,最终通过大数据平台进行系统的实现。可采用本科英语、日语等学习水平和统考通过率作为示例进行相应策略制定。

     本课题运用人工智能,数据挖掘等核心技术,与课题相关的三款同类软件分别为: KNIME,Clause,Keyence

 

1.这些软件的开发者是怎么说服你(陌⽣⼈)成为他们的⽤户的?他们的⽬标都是盈利么?他们的⽬标都是赚取⽤户的现⾦么?还是别的?

     这些软件的开发商在宣传自己的商品时着重突出该类产品与市面上其他同类产品与众不同的地方,突出强调自己的创新点和先进性,

他们的⽬标并不都是盈利,其中 Keyence的开发商是收费的,其他两款软件则是开源或者无偿提供给用户服务的,他们的目标并不一定是赚取用户的金钱或者说不只只是金钱,当用户在使用产品的过程中会留下使用的痕迹包括一些数据,用户信息,标签等等宝贵的数据,这些东西可能会带给公司在拓展软件开发或者优化软件性能等方面大有裨益,所以说单纯的赚取金钱或者等价物其实不完全是这些公司的首要目标或者是唯一目标,他们的盈利模式往往是全方面或者有益于推进公司发展前景的。

 

2.这些软件是如何到你⼿⾥的(邮购,下载,互相拷⻉、在线使用……)

      这些软件获得的方式有很多种。像knime,clause软件在github上可以找到其相关资源甚至是源代码,而Keyence则是商用的,在其官方网站上可以找到完整的服务信息。

 

3.这些软件有Bug 么?⼜是如何更新新版本的?

     当然有bug,人工智能和机器学习本来就是一个不断迭代和更新的概念,其实软件有bug不一定是坏事,一个长久没有更新的软件不是一款真正意义上的好软件,一个永远没有bug的软件也是不切实际的,在github上,软件的开发者会定期更新该软件的一些issue,这些issue里面就包括bug的解释说明和补丁包,用于定期向客户提供可靠的服务以使得软件具有稳定的使用性能,并能够不断的适应新的运行环境和客户需求。

 

4.此类软件是什么时候开始出现的,同⼀类型的软件之间是如何竞争的? 发展趋势如何?

      这里以数据挖掘的软件举例分析一波:KNIME是一款强大开源的数据挖掘软件平台,当然数据挖掘技术是伴随着人工智能领域的崛起而不断演进的,人工智能的概念虽然早在上个世纪就被人提出,但是其发展迅猛的势头还是近几年才开始火热起来的,其实用户掌握python后也能够简单的在网络上爬取数据,但是KNIME软件数据分析平台最引人注目的是其强大的数据和工具的集成能力:

      容易与第三方的大数据框架集成其通过大数据组件的扩展(Big Data Extension)能够方便的和Apache的Hadoop和Spark等大数据框架集成在一起,非常的容易使用。

      兼容多种数据形式其不但支持纯文本,数据库,文档,图像,网络,甚至还支持基于Hadoop的数据格式兼容多种数据分析工具和语言其不但集成了很多的工具,包括支持R语言和Python语言的脚本,从而让专家经验被复用强大的可视化功能提供了易于使用的图形化接口,能够把分析结果通过生动形象的图形展示给用户。最最最重要的是其提供了1500多个模块,且现在还在不断的增长,通过这些模块:

      支持主要的文件格式和数据库本地和数据库数据的调整和转换支持主流的数据格式:XML, JSON, 图形, 文档等非常容易与第三方的机器学习库集成使用,比如H2O,Keras,Scikit-Learn等提供基于Web报告或者数据视图的展示支持动态工作流的设计

 

 

KNIME软件平台

 

      谈到发展趋势的话,应该来说前景还是很不错的,这软数据挖掘软件功能可不是简简单单的拔取数据这么简单,其通过数据挖掘可以从大量有序或者杂乱无章的数据中发现潜在的规律,甚至通过训练学习还能通过已知的数据预测未来的发展变化,今天就给大家推荐一款强大开源的数据挖掘软件平台:KNIME数据分析平台。其提供了自建服务器版和云版两种支持方式,其基本的工作流程如下,先读取要分析的数据,然后对其中的一些数据进行转换,然后分析出其中的规律,最后部署到平台。可见其发展前景还是值得称赞的。

 

5. 列举你在使⽤上述软件时观察到的“特殊”现象,它们和硬件有什么不同?这些能说明软件的某些本质特性么?

  使用此类软件可以随意地复制,也可以根据自己的需要对源代码进行修改,可以方便地更新到最新版本。对于不同的操作系统,需要下载不同的版本。而对于硬件来说,可能可以进行一些修改,但是不可能随意地复制。

  这些说明了软件的可移植性、可复用性和可维护性。


6.你个⼈第⼀次⽤此类软件是什么时候,你当时是⼏年级,班主任叫什么?在哪⾥,什么状态,当时的软件是如何得到的(买的正版,盗版,下载?)

      本人第一次接触到这款产品是在大学四年级做毕业设计的时候,当时班主任叫罗红品,因为是做毕业设计,时间不多,使用这款产品给我提供了很方便的用户使用体验,节省了很多时间,当时因为是github上的开源软件,就无所谓正版这个说法了。

 

7.你是如何精通这类软件的?它给你什么好处,坏处?

      目前使用起来不能说是精通,并没有经常使用此类软件。好处的话,这类软件可以帮助我进行数据挖掘和数据分析,功能很强大,毕竟毕业设计用的是他呢。缺点是这款软件对初学者不太友好,毕竟网上的相关学习资料不是很多,需要有一定的自学能力和学习功底。

 

8. 你现在还⽤它么,或者是同类软件的不同品牌,为何?

      现在还在使用, 这款软件和python配合起来一起使用效果更佳,前者可以采集数据和初步的处理数据,那么后者的话就对初步处理的数据进行更深一步的分析与总结,往往在最后会得到令人满意别的结果。

 

9. 这种软件再过10年,20年还会存在么,为什么?

  会存在,不过可能到时候可能都开发到10.0,11.0这个版本了,毕竟数据挖掘技术的更新迭代越来越快,软件开发商必须与时俱进,不断开拓出新的版本才能适应千变万化的版本问题,作为学生,我们也要与时俱进,保持学习的心态,这样才能跟上时代的脚步。

 

 

posted on 2019-10-09 19:50  wds1846928068  阅读(145)  评论(0编辑  收藏  举报