2 Fork me on GitHub 6

第一次个人编程作业

软件工程第一次个人编程作业

| 软件工程 | https://edu.cnblogs.com/campus/gdgy/informationsecurity1812/ |
| ---- | ---- | ---- |
| 作业要求 | https://edu.cnblogs.com/campus/gdgy/informationsecurity1812/homework/11155 |
| 作业目标 |论文查重(java实现)|

github地址:https://github.com/Sdream1/3118005406
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟
Planning 计划 30 30
Estimate 估计这个任务需要多少时间 30 30
Development 开发 480 540
Analysis 需求分析 (包括学习新技术) 30 60
Design Spec 生成设计文档 10 10
Design Review 设计复审 5 5
Coding Standard 代码规范 (为目前的开发制定合适的规范) 10 10
Design 具体设计 30 30
Coding 具体编码 180 180
Code Review 代码复审 120 120
Test 测试(自我测试,修改代码,提交修改) 120 120
Reporting 报告 30 30
Test Repor 测试报告 10 10
Size Measurement 计算工作量 10 10
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 10 10
合计 985 1075

设计思路

1、读取文档中字符串数据
2、用ansj对文档字符串进行分词
3、根据文章分词后的词频计算词频向量
4、利用余弦定理计算两个词频向量之间的余弦值作为两篇文章的余弦相似度
5、将结果输出到指定文件上

主要方法


运行


测试

提供的文件和随便找的一个不同的文档

性能分析


总结

java没学好hhh,被两个小错误卡了很多时间;
很多算法优化没有做;
以前没做过测试、性能分析什么的,所以这次做起来挺乱的;
为了接下来的作业还是得补一下java啊...
总体下来也算体验了一次个人项目的整个流程,获益匪浅。

posted @ 2020-09-24 20:58  友人D  阅读(117)  评论(0编辑  收藏  举报