计算与软件工程第4次作业

作业要求	https://edu.cnblogs.com/campus/jssf/infor_computation17-31/homework/10534
我的课程目标	对代码进行复审，学习结对编程，学会合作开发程序。
其他参考文献	https://www.jianshu.com/p/e0000ba73a72 https://blog.csdn.net/Shiny0815/article/details/100099188
作业正文	https://www.cnblogs.com/yuhanzhou/p/12604290.html

作业1

作业评论

小结

对于代码规范复审的格式要注意的几点包括：缩进(4个空格，在VS2005和其他的一些编辑工具中都可以定义Tab键扩展成为几个空格键。不用 Tab键的理由是Tab键在不同的情况下会显示不同的长度。4个空格的距离从可读性来说正好)、行宽(行宽必须限制，但是以前有些文档规定的80字符行宽太小了（以前的计算机/打字机显示行宽为80字符），现在时代不同了，可为100字符)、括号(在复杂的条件表达式中，用括号清楚地表示逻辑优先级)、断行与空白的{}行、分行(不要把多行语句放在一行上，更严格地说，不要把不同的变量定义在一行上)、命名(int、byte、char、bool等)、下划线(下划线用来分隔变量名字中的作用域标注和变量的语义)、大小写(由多个单词组成的变量名，如果全部都是小写，很不易读，一个简单的解决方案就是用大小写区分它们)、注释(复杂的注释应该放在函数头，很多函数头的注释都是解释参数的类型等的，如果程序正文已经能够说明参数的类型in/out等，就不要重复。注释也要随着程序的修改而不断更新，一个误导的（Misleading）注释往往比没有注释更糟糕。注释（包括所有源代码）应只用ASCII字符，不要用中文或其他特殊字符)等。
代码编写过程中虽然软件换行会自动缩进，但是复制粘贴会导致结构紊乱，就影响了美观。还要注重注释，好的注释可以让读者更加理解你的代码。

作业2 结对编程

1、下载Python3.8.2

2、Python安装jieba，wordcloud，Matplotlib第三方库

matplotlib没有安装成功，尝试了很多方法都失败了，所以画图实在Excel中完成的。

代码

import jieba
excludes = {"什么","一个","我们","那里","你们","如今","说道","知道","起来","姑娘","这里","出来","他们","众人","自己",
            "一面","只见","怎么","奶奶","两个","没有","不是","不知","这个","听见","这样","进来","咱们","告诉","就是",
            "东西","袭人","回来","只是","大家","只得","老爷","丫头","这些","不敢","出去","所以","不过","的话","不好",
            "姐姐","探春","鸳鸯","一时","不能","过来","心里","如此","今日","银子","几个","答应","二人","还有","只管",
            "这么","说话","一回","那边","这话","外头","打发","自然","今儿","罢了","屋里","那些","听说","小丫头","不用","如何"}
'''
这些是一些干扰词汇，先列出，之后把这些词删除
'''
txt = open("红楼梦.txt","r",encoding='utf-8').read()
'''
不写明路径的话，默认和保存的python文件在同一目录下 注意打开格式是utf-8，这个可以打开txt文件，选择另存为，注意界面右下角的格式
'''
words = jieba.lcut(txt)
'''
利用jieba库将红楼梦的所有语句分成词汇
'''
counts = {}
'''
创建的一个空的字典
'''
for word in words:
    if len(word) == 1:
        continue
    else:         counts[word] = counts.get(word,0) + 1
    '''
    如果字典中没有这个健（名字）则创建，如果有这个健那么就给他的计数加一
    [姓名:数量]，这里是数量加一
    '''
for word in excludes:			
    del(counts[word])
    '''
    #这一步：如果列出的干扰词汇在分完词后的所有词汇中那么删除
    '''
items = list(counts.items())
'''
把保存[姓名：个数]的字典转换成列表
'''
items.sort(key=lambda x:x[1],reverse = True)
'''
对上述列表进行排序，'True'是降序排列
'''
for i in range(10):
    word,count = items[i]
    print("{0:<10}{1:>5}".format(word,count))

绘图代码是网上搜索的，由于未安装matplotlib所以未能实现

import jieba
from collections import Counter
import matplotlib.pyplot as plt
import numpy as np
class HlmNameCount():
    # 此函数用于绘制条形图
    def showNameBar(self,name_list_sort,name_list_count):
        # x代表条形数量
        x = np.arange(len(name_list_sort))
        # 处理中文乱码
        plt.rcParams['font.sans-serif'] = ['SimHei']
        # 绘制条形图，bars相当于句柄
        bars = plt.bar(x,name_list_count)
        # 给各条形打上标签
        plt.xticks(x,name_list_sort)
        # 显示各条形具体数量
        i = 0
        for bar in bars:
            plt.text((bar.get_x() + bar.get_width() / 2), bar.get_height(), '%d' % name_list_count[i], ha='center', va='bottom')
            i += 1
        # 显示图形
        plt.show()

    # 此函数用于绘制饼状图
    def showNamePie(self, name_list_sort, name_list_fracs):
        # 处理中文乱码
        plt.rcParams['font.sans-serif'] = ['SimHei']
        # 绘制饼状图
        plt.pie(name_list_fracs, labels=name_list_sort, autopct='%1.2f%%', shadow=True)
        # 显示图形
        plt.show()

    def getNameTimesSort(self,name_list,txt_path):
        # 将所有人名临时添加到jieba所用字典，以使jieba能识别所有人名
        for k in name_list:
            jieba.add_word(k)
        # 打开并读取txt文件
        file_obj = open(txt_path, 'rb').read()
        # jieba分词
        jieba_cut = jieba.cut(file_obj)
        # Counter重新组装以方便读取
        book_counter = Counter(jieba_cut)
        # 人名列表，因为要处理凤姐所以不直接用name_list
        name_dict ={}
        # 人名出现的总次数，用于后边计算百分比
        name_total_count = 0
        for k in name_list:
            if k == '熙凤':
                # 将熙凤出现的次数合并到凤姐
                name_dict['凤姐'] += book_counter[k]
            else:
                name_dict[k] = book_counter[k]
            name_total_count += book_counter[k]
        # Counter重新组装以使用most_common排序
        name_counter = Counter(name_dict)
        # 按出现次数排序后的人名列表
        name_list_sort = []
        # 按出现次数排序后的人名百分比列表
        name_list_fracs = []
        # 按出现次数排序后的人名次数列表
        name_list_count = []
        for k,v in name_counter.most_common():
            name_list_sort.append(k)
            name_list_fracs.append(round(v/name_total_count,2)*100)
            name_list_count.append(v)
            # print(k+':'+str(v))
        # 绘制条形图
        self.showNameBar(name_list_sort, name_list_count)
        # 绘制饼状图
        self.showNamePie(name_list_sort,name_list_fracs)
        

if __name__ == '__main__':
    # 参与统计的人名列表
    name_list = ['宝玉', '贾母', '凤姐', '王夫人', '奶奶', '贾琏', '平儿', '黛玉', '宝钗', '老爷' ]
    # 红楼梦txt文件所在路径
    txt_path = 'D:\红楼梦.txt'
    hnc = HlmNameCount()
    hnc.getNameTimesSort(name_list,txt_path)

找了一个简单的单元测试的代码，但是如何和现有代码进行融合还没尝试

import unittest

class MyTest(unittest.TestCase):  # 继承unittest.TestCase
    def tearDown(self):
        # 每个测试用例执行之后做操作
        print('111')

    def setUp(self):
        # 每个测试用例执行之前做操作
        print('22222')

    @classmethod
    def tearDownClass(self):
    # 必须使用 @ classmethod装饰器, 所有test运行完后运行一次
         print('4444444')
    @classmethod
    def setUpClass(self):
    # 必须使用@classmethod 装饰器,所有test运行前运行一次
        print('33333')

    def test_a_run(self):
        self.assertEqual(1, 1)  # 测试用例
        
    def test_b_run(self):
        self.assertEqual(2, 2)  # 测试用例
        
if __name__ == '__main__':
    unittest.main()#运行所有的测试用例

总结

这次的作业是需要两人合作的，下载了Python进行操作，更换了四个版本还是没有成功下载matplotlib，由于时间问题还有再继续尝试，后续有时间会查找原因，补充作业。对于python的一些运用掌握的还不是很好，初步的编写代码和运行是可以实现的，单元测试只是做了初步的了解，还没有深究，这次的合作让我知道了有些事情一个人很难去完成，正所谓众人拾柴火焰高，不过现在只能远程电话视频联系，稍微有点不方便，相信以后有机会会做的更好。

码云链接

https://gitee.com/semana/warehouse

posted @ 2020-03-31 12:15 Semana 阅读(629) 评论(0) 编辑收藏举报

刷新页面返回顶部

周宇涵

计算与软件工程第4次作业

作业1

作业评论

小结

作业2 结对编程

1、下载Python3.8.2

2、Python安装jieba，wordcloud，Matplotlib第三方库

代码

绘图代码是网上搜索的，由于未安装matplotlib所以未能实现

找了一个简单的单元测试的代码，但是如何和现有代码进行融合还没尝试

总结

码云链接

公告

周宇涵

计算与软件工程 第4次作业

作业1

作业评论

小结

作业2 结对编程

1、下载Python3.8.2

2、Python安装jieba，wordcloud，Matplotlib第三方库

代码

绘图代码是网上搜索的，由于未安装matplotlib所以未能实现

找了一个简单的单元测试的代码，但是如何和现有代码进行融合还没尝试

总结

码云链接

公告

计算与软件工程第4次作业