第一次个人作业

作业声明

| 这个作业属于哪个课程 | 班级链接 |
| ---- | ---- | ---- |
| 这个作业要求在哪里 |个人项目作业 |
|这个作业的目标 | 论文查重 |

1.作业github链接

作业github链接

2、计算模块接口的设计与实现过程

想要算出第二篇论文是否抄袭了第一篇论文,并且计算出抄袭的程度,试着写一个程序来实现,上网搜资料后知道,可以用这样的一个方法:把论文变成一种叫做词嵌入的格式,然后再用神经网络再把词嵌入变成特征向量,但是用了很多次神经网络之后,向量就会变得太大太复杂,所以用几次之后就要简化一次特征向量,经过几轮重复之后,就可以用计算两个向量的相似度,也就是题目要的抄袭程度,重复率

流程图

实现过程

按照下面这样的命令依次输入和回车,就可以算出老师给的五篇论文的重复率






3、计算模块接口部分的性能改进

性能分析

消耗最大的函数

4、计算模块部分单元测试展示

输出覆盖率


5、计算模块部分异常处理说明

如果文件名输入错了,就会报错说没有该文件存在,把文件名确认一次就好了

6.PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 15 15
· Estimate · 估计这个任务需要多少时间 20 15
Development 开发 600 800
· Analysis · 需求分析 (包括学习新技术) 180 240
· Design Spec · 生成设计文档 30 45
· Design Review · 设计复审 20 30
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 30 45
· Design · 具体设计 60 90
· Coding · 具体编码 360 420
· Code Review · 代码复审 30 30
· Test · 测试(自我测试,修改代码,提交修改) 60 60
Reporting 报告 30 45
· Test Repor · 测试报告 30 20
· Size Measurement · 计算工作量 15 30
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 15 25
· 合计 1495 1910``
posted @ 2021-09-18 10:29  取ID好难  阅读(46)  评论(0编辑  收藏  举报