代码改变世界

《信息技术手册查重错误比对分析》开发记录1

2019-03-19 20:45  默默不语  阅读(294)  评论(0编辑  收藏  举报

项目名称:信息技术手册查重错误比对分析

功能概述:

(1) 数据导入:要求将提供的信息技术手册文档倒入数据库中

(2) 数据分类:将手册涉及的热词自动分类展示,将每个热词自动创建关键字、模糊检索两个字段便于检索;

(3)数据查重错误分析报告:按照提供的维普论文检测报告的形式,将信息技术手册中的所有词语解释与网络资源(例如百度百科等),至少提供两个网络资源实现全文检索查重,并分析根据名词解释的上下文的关系判断出词语使用错误的情况,生成检测报告。

 

开发设想:

第一步先将问题分解,实现将Word文档导入数据库中,首先要实现Java如何访问Word文档,并对其进行操作,其次因为将Word文档导入数据库中的难点在于Word文档有很多样式,不容易将内容分开,如一级标题、二级标题、正文等内容,可以分开内容后在设计数据库表格,如何存储Word文档内容。