第一次个人编程作业
一、PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 30 | 40 |
· Estimate | · 估计这个任务需要多少时间 | 600 | 800 |
Development | 开发 | 60 | 60 |
· Analysis | · 需求分析 (包括学习新技术) | 120 | 150 |
· Design Spec | · 生成设计文档 | 0 | 0 |
· Design Review | · 设计复审 | 0 | 0 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 30 | 30 |
· Design | · 具体设计 | 60 | 60 |
· Coding | · 具体编码 | 180 | 360 |
· Code Review | · 代码复审 | 30 | 30 |
· Test | · 测试(自我测试,修改代码,提交修改) | 60 | 180 |
Reporting | 报告 | 0 | 0 |
· Test Repor | · 测试报告 | 0 | 0 |
· Size Measurement | · 计算工作量 | 20 | 20 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 30 | 30 |
· 合计 | 1220 | 1760 |
二、计算模块接口
-
(3.1)计算模块接口的设计与实现过程。设计包括代码如何组织,比如会有几个类,几个函数,他们之间关系如何,关键函数是否需要画出流程图?说明你的算法的关键(不必列出源代码),以及独到之处。
- 定义了一个find函数用于将样例文本遍历匹配,定义了敏感词类和将样例文本逐行保存的line类,然后将匹配得到的答案信息存入答案类。
- 算法的关键:将控制台设置成utf-8编码,而后因为中文有三个字节的utf-8编码,从而对中文敏感词三个字节长度的匹配,匹配到第一个敏感字记录下来,中间若没有插入数字字母换行符则继续匹配,当全部敏感词匹配完成记录末尾信息。英文敏感词则直接单字节遍历匹配。这种算法只能检测出部分中文敏感词,变形的无法检测出来。
-
(3.2)计算模块接口部分的性能改进。记录在改进计算模块性能上所花费的时间,描述你改进的思路,并展示一张性能分析图(由VS 2019、JProfiler或者Jetbrains系列IDE自带的Profiler的性能分析工具自动生成),并展示你程序中消耗最大的函数。
- 由于本人能力有限,对各模块几乎没什么改进,本来打算用字符数组直接存入测试内容,而后在主函数进行搜索输出,不知为什么字符串下标超出范围,只好存入类里进行搜索。除了主函数外只有一个find函数。(vs摘要截图)
(vs函数截图)
- 由于本人能力有限,对各模块几乎没什么改进,本来打算用字符数组直接存入测试内容,而后在主函数进行搜索输出,不知为什么字符串下标超出范围,只好存入类里进行搜索。除了主函数外只有一个find函数。(vs摘要截图)
-
(3.3)计算模块部分单元测试展示。展示出项目部分单元测试代码,并说明测试的函数,构造测试数据的思路。并将单元测试得到的测试覆盖率截图,发表在博客中。
- 敏感词
- 测试文本,测试数据有包括正常的敏感词,和穿插字符的敏感词,基本都可以检测出来,变形的中文敏感词无法检测
- 答案
- 敏感词
-
(3.4)计算模块部分异常处理说明。在博客中详细介绍每种异常的设计目标。每种异常都要选择一个单元测试样例发布在博客中,并指明错误对应的场景。
- 本次编译过程最大的问题就是字符串数组越界了,在主函数读入测试正文的时候就搜索并输出答案,因为越界而且还不知道如何修正,于是便先将输入的内容存入外面的类数组而后再进行检测。
三、心得
- (4.1)在完成本次作业过程的心得体会。
- 深刻感受到自己的知识能力水平太低,基本没有去主动学习什么东西,在这次作业中便暴露的明明白白,初次使用VS,初次使用github,使用这些新工具也需要去学习,对于c++的知识也忘的差不多了,也是第一次使用文件输入输出流,为此翻出了早已放在一旁的c++课本,对于中文文件的一窍不通,也去了解了utf-8编码的相关知识,转为utf-8编码来做。
- 看到大部分同学都是用python和java来做,流下了羡慕的泪水,果然去多学习掌握其他的语言对于自身是非常有帮助的,身边的同学们都说这题用python来做会方便许多于是我也准备开始学python了。