第一次软工作业

第一次软工作业

项目 内容
第一次软工作业 作业要求
作业目的 提高编程能力

github地址:https://github.com/ECLE10/zuoye

P2P表格

P2P2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 50 60
Estimate 估计这个任务需要多少时间 40 50
Development 开发 890 1500
Analysis 需求分析 (包括学习新技术) 450 560
Design Spec 生成设计文档 40 50
Design Review 设计复审 60 70
Coding Standard 代码规范 (为目前的开发制定合适的规范) 80 90
Design 具体设计 70 80
Coding 具体编码 220 350
Code Review 代码复审 60 80
Test 测试(自我测试,修改代码,提交修改) 70 80
Reporting 报告 80 100
Test Repor 测试报告 50 60
Size Measurement 计算工作量 40 45
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 50 60
合计 2250 3235

计算模块接口的设计与实现过程

实现原理:余弦值的范围在[-1,1]之间,值越趋近于1,文档越相似;接近于0,表示两篇文章没有相似之处。

基本思路是:如果这两句话的用词越相似,它们的内容就应该越相似。因此,可以从词频入手,计算它们的相似程度。
1 分词。
句子A:这只/皮靴/号码/大了。那只/号码/合适。
句子B:这只/皮靴/号码/不/小,那只/更/合适。
2 列出所有的词。
这只,皮靴,号码,大了。那只,合适,不,小,很
3 计算词频。
句子A:这只1,皮靴1,号码2,大了1。那只1,合适1,不0,小0,更0
句子B:这只1,皮靴1,号码1,大了0。那只1,合适1,不1,小1,更1
4 写出词频向量。
句子A:(1,1,2,1,1,1,0,0,0)
句子B:(1,1,1,0,1,1,1,1,1)

关键函数


计算模块部分单元测试

计算模块改进

使用工具测试性能

代码覆盖率

计算模块部分异常处理说明

文本编码错误 出现异常

总结

本次任务对于我来说有点困难 所以在deadline之后才堪堪完成 难点在于分句函数的理解和使用 对比函数的使用

posted @ 2020-09-25 11:04  *ECLE  阅读(145)  评论(1编辑  收藏  举报