一、编码要求

GitHub链接:[https://github.com/wjx0110/031802232]:

二、计算模块接口的设计与实现过程

1、流程图

2、代码的读取:刚开始不懂应该怎么写,从网上看了许多大佬的代码,又去学了python的一些基础知识,但也只是一些皮毛,最终在众多的代码中选择了余弦的相似度的计算。(OS:这也太难了吧!!!)
附上大佬的博客:https://blog.csdn.net/kobeyu652453/article/details/106397319/ https://www.cnblogs.com/zuixime0515/p/9206861.html
3、代码的实现:
def words2vec(words1=None, words2=None):
    v1 = []
    v2 = []
    tag1 = jieba.analyse.extract_tags(words1, withWeight=True)
    tag2 = jieba.analyse.extract_tags(words2, withWeight=True)
    tag_dict1 = {i[0]: i[1] for i in tag1}
    tag_dict2 = {i[0]: i[1] for i in tag2}
    merged_tag = set(tag_dict1.keys()) | set(tag_dict2.keys())
    for i in merged_tag:
        if i in tag_dict1:
            v1.append(tag_dict1[i])
        else:
            v1.append(0)
        if i in tag_dict2:
            v2.append(tag_dict2[i])
        else:
            v2.append(0)
    return v1, v2


def cosine_similarity(vector1, vector2):
    dot_product = 0.0
    normA = 0.0
    normB = 0.0
    for a, b in zip(vector1, vector2):
        dot_product += a * b
        normA += a ** 2
        normB += b ** 2
    if normA == 0.0 or normB == 0.0:
        return 0
    else:
        return round(dot_product / ((normA ** 0.5) * (normB ** 0.5)) , 2)


def cosine(str1, str2):
    vec1, vec2 = words2vec(str1, str2)
    return cosine_similarity(vec1, vec2)
4、单元测试的示例
D:\project\sim_0.8\orig.txt 
D:\project\sim_0.8\orig_0.8_add.txt 
similarity=0.94
D:\project\sim_0.8\orig.txt 
D:\project\sim_0.8\orig_0.8_del.txt 
similarity=0.93
D:\project\sim_0.8\orig.txt 
D:\project\sim_0.8\orig_0.8_dis_1.txt
similarity=0.99
D:\project\sim_0.8\orig.txt 
D:\project\sim_0.8\orig_0.8_dis_3.txt 
similarity=0.96
D:\project\sim_0.8\orig.txt
 D:\project\sim_0.8\orig_0.8_dis_7.txt 
similarity=0.96
D:\project\sim_0.8\orig.txt 
D:\project\sim_0.8\orig_0.8_dis_15.txt
similarity=0.91
D:\project\sim_0.8\orig.txt 
D:\project\sim_0.8\orig_0.8_dis_10.txt 
similarity=0.95
D:\project\sim_0.8\orig.txt
 D:\project\sim_0.8\orig_0.8_mix.txt 
similarity=0.94
D:\project\sim_0.8\orig.txt
 D:\project\sim_0.8\orig_0.8_rep.txt
similarity=0.95

三、性能分析图

(利用pycharm的profile)

四、PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
· Planning · 计划 20 20
· Estimate · 估计这个任务需要多少时间 30 30
· Development · 开发 110 130
· Analysis · 需求分析 (包括学习新技术) 1200 1300
· Design Spec · 生成设计文档 30 30
· Design Review · 设计复审 30 30
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 50 50
· Design · 具体设计 300 320
· Coding · 具体编码 360 400
· Code Review · 代码复审 50 80
· Test · 测试(自我测试,修改代码,提交修改 140 160
· Reporting · 报告 30 30
· Test Repor · 测试报告 30 30
· Size Measurement · 计算工作量 15 20
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 70 70
· 合计 2465 2700

五、个人总结

1、通过这次实践作业,我认识到了自己的不足,在计算机语言学习方面还要继续努力(ps:软工实践的作业好难啊!!,看着大佬们一个接一个的交作业,而我还在不停的开网页学习,还没有什么思路,在崩溃的边缘疯狂试探)

2、终于搞定了作业,在软工作业的推动下,我还去学习了一些python的知识(虽然只是一些皮毛,只能跟着大佬的步伐)。

3、软工虽难,但还是要继续努力学习鸭!(菜鸡真的很想哭😭)

posted on 2020-09-17 14:20  wjiaxin  阅读(161)  评论(0编辑  收藏  举报