软件工程第二次作业 论文查重
这个作业属于哪个课程 | 2023软件工程-双学位(广东工业大学-计算机学院) |
---|---|
这个作业要求在哪里 | 个人项目作业-论文查重 |
这个作业的目标 | 设计一个论文查重算法 |
其他参考文献 |
1. 作业gitcode链接
2.计算模块接口的设计与实现过程
作业要求是设计一个论文查重系统。
- 首先,需要了解论文查重的原理以及基本算法。
可能用到的算法有字符串匹配算法、哈希算法、SimHash等。 - 接着,尝试编写算法。
- 然后,用上述算法进行处理,计算出相关数据。
先读取原论文文件,以及抄袭版论文文件。
然后,比较两者的字符串信息。
对匹配结果进行比较,根据匹配的相似度来判断是否为抄袭行为。但字符串匹配算法可以检测出相同的字符序列,但无法检测出意义相同但表达不同的文字。因此,仍需要补充其他方式。
3.PSP
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 60 | 150 |
Estimate | 估计这个任务需要多少时间 | 80 | 90 |
Development | 开发 | 200 | 185 |
Analysis | 需求分析 (包括学习新技术) | 240 | 600 |
Design Spec | 生成设计文档 | 60 | 220 |
Design Review | 设计复审 | 45 | 30 |
Coding Standard | 代码规范 (为目前的开发制定合适的规范) | 45 | 30 |
Design | 具体设计 | 200 | 300 |
Coding | 具体编码 | 220 | 450 |
Code Review | 代码复审 | 120 | 180 |
Test | 测试(自我测试,修改代码,提交修改) | 30 | 120 |
Reporting | 报告 | 30 | 100 |
Test Repor | 测试报告 | 30 | 60 |
Size Measurement | 计算工作量 | 25 | 35 |
Postmortem & Process Improvement Plan | 事后总结, 并提出过程改进计划 | 60 | 45 |
合计 | 1445 | 2595 |
4.总结分析
由于没有学习和使用过作业要求相关语言,在学习新技术上花费了大量时间。但仍难以顺利按作业要求将“论文查重程序”编写出。努力尝试使用c语言进行编写,仍不能较好完成。通过这次的作业,深知自身技术、能力上的巨大缺陷,日后需加倍努力,勤奋学习,弥补不足。