软件需求工程与建模--搜索引擎项目--项目概述

一。Gitbub网址　　

　　　　　　韩昇范: https://github.com/hansf14/WebpageAnalysis

陈家乐: https://github.com/richardevan

金奭炫: https://github.com/sh0116

　　这是一咱们想要自己实现的 Search Engine（搜索引擎）+ 搜索出来的网项之间的关系、网项与输入的keyword 之间的关系图可视化软件。就类似于百度和Google一样而咱们还加上了搜索结果的关系可视化。在电脑上(*或手机)上可以输入一个单词或句子，给出搜索结果并可视化。

　　N（Need 需求）

　　　　随着技术的进步，所有的事情都可以通过谷歌或百度搜索。但有时候结果是一篇很长而且有时候难以理解的文章。通过这个搜索引擎，可以让搜索者更容易找到想要的结果。我们希望通过本次项目来再次巩固一下使用编程语言基础、新的算法框架、新的应用技术。

　　A（Approach 方法）

　　　　所有人可以通过电脑（*或者手机)上的浏览器访问网站。我们设想的实现步骤如下：

- 通过用 Python 编写的 Python Crawler (Python爬虫)收集几个网站上的一堆网项，将这些存储到我们的数据库里（信息累积）。
- 通过用 C++ 编写的程序(搜索引擎)将累积的网项根据已有的280，000个左右个单词组成的词库里的单词来索引，程序还需要支持 DBMS (数据管理系统)软件的一些文件管理系统的基本功能。
- 从用户输入一个单词或一个句子，将有关(包含对应keyword)的网项显示到我们要设计的一个网站上。
- 通过Python(和 Java；如果还考虑Android 手机上运行)与前端的接口对接。
- 将对应的结果中的网项之间的关系（相关度）与 keyword之间的关系, 用 d3.js 来可视化到此网项上。

　　B（Benefit 好处）

　　C（Competitors 竞争）

　　　　在学校里好像没有具有与此类似功能的软件。校外有较多搜索引擎，如Baidu百度和Google谷歌。可是这些搜索引擎缺少有关网项之间的可视化且用户不能按照觉得更重要的keyword来查看搜索结果。

　　D（Delivery 推广）

　　　　此款产品使用,应用范围首先初步锁定在为大学教育工作者, 学生。若进一步优化爬虫,索引,查找算法,并改善存储数据的方法还能为更大规模的用户提供服务, 扩展。

posted @ 2018-05-15 00:28 软件需求工程与建模小组阅读(270) 评论(0) 编辑收藏举报

刷新页面返回顶部