个人作业

  • 个人介绍
  • PSP流程管理

    计划及开发阶段

    阶段 预计时间 时间
    作业要求分析 10分钟 30分钟
    任务规划 30分钟 30分钟
    步骤零实现 35分钟 20分钟
    步骤一实现 40分钟 25分钟
    步骤二实现 15分钟 5分钟
    步骤三实现 40分钟 未完成
    步骤四实现 30分钟 未完成
  • 程序设计思路
    • 步骤零 输出某个英文文本文件中 26 字母出现的频率,由高到低排列
      • 使用IO流从文件中读取文件内容
      • 使用正则表达式替换非A-Z、a-z的内容
      • 将替换后的结果转换为char类型数组
      • 使用Map保存结果(key唯一,key存在时更改value,不存在时置入)
      • 对key的结果进行处理(取百分比、排序)
      • 输出结果
    • 步骤一 输出单个文件中的前 N 个最常出现的英语单词。
      • 输出不重复的单词,按照出现次数排列
        • 使用正则表达式对读取的内容进行处理(条件:非字母数字)
        • 使用Map保存结果(key唯一,key存在时更改value,不存在时置入)
        • 对key的结果进行处理(排序)
        • 返回结果
      • 指定文件目录,对目录下每一个文件执行 wf.exe -f 的操作。
        • 获得目录下文件列表
        • 如果是文件,执行-f操作,如果是目录,根据是否携带迭代标识处理,如果携带迭代标识,调用自身方法,对本目录下的所有内容递归处理
        • 返回结果
      • 支持 -n 参数,输出出现次数最多的前 n 个单词
        • 在输出时,判断是否存在-n参数,如果存在,则根据-n指定的单词数量进行控制
    • 步骤2 支持stop words
      • 在统计词频时,判断是否存在停词表参数
      • 存在停词表参数时,读取停词表文件
      • 对停词表文件进行处理,得到List
      • 在处理词频时,判断其是否在停词表内,如果存在,跳过单次循环
  • 单元测试思路
    • 对于步骤零的测试思路
      • 不携带文件对象
      • 携带错误文件对象(不存在)
      • 携带错误文件对象(为目录)
      • 携带正确文件对象
  • 效能分析报告
posted @ 2020-10-09 22:45  FengXuan  阅读(118)  评论(1编辑  收藏  举报