《信息技术手册查重错误比对分析》开发记录1
2019-03-19 20:45 默默不语 阅读(294) 评论(0) 编辑 收藏 举报项目名称:信息技术手册查重错误比对分析
功能概述:
(1) 数据导入:要求将提供的信息技术手册文档倒入数据库中
(2) 数据分类:将手册涉及的热词自动分类展示,将每个热词自动创建关键字、模糊检索两个字段便于检索;
(3)数据查重错误分析报告:按照提供的维普论文检测报告的形式,将信息技术手册中的所有词语解释与网络资源(例如百度百科等),至少提供两个网络资源实现全文检索查重,并分析根据名词解释的上下文的关系判断出词语使用错误的情况,生成检测报告。
开发设想:
第一步先将问题分解,实现将Word文档导入数据库中,首先要实现Java如何访问Word文档,并对其进行操作,其次因为将Word文档导入数据库中的难点在于Word文档有很多样式,不容易将内容分开,如一级标题、二级标题、正文等内容,可以分开内容后在设计数据库表格,如何存储Word文档内容。