201671010401包稚潼 实验二 词频统计软件项目报告

  • 需求分析

    (1)程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
    (2)程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
  • 可行性分析

    (1)操作可行性:系统的操作方式能否在用户组织内行得通,词频统计所需要的资源有限。
    (2)经济可行性:从经济角度考虑,规划方案的实现性和开发的价值,本次是一个作业,不存在经济问题。
    (3)技术可行性:要考虑采用的硬件和软件能否满足用户需求。
  • 基本功能

    (1)指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
    (2)高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
    (3)统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
  • 环境需求

    1.测试机环境:Windows环境
    2.JDK版本:jdk8u161
    3.JRE版本:jre8u161
  • 功能设计

    1.新建文本文件data.txt并且统计各个单词出现的次数
    2.如果次数相同,安装单词的字典顺序排序,输出单词个数
    3.输入要查询的单词,显示它出现的次数 ,用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。.统计该文本所有单词数量及词频数
    4.输出结果并将其存储到result.txt文件中
  • 设计实现

    此软件有两个类:(1)WordCount.java主要实现文件的读入和选择对应的功能。根据用户输入的选择调用对应的方法。
    (2)方法在Tongji.java中,oneWord(取一个单词的频率),gaopin(根据用户输入的k值取高频词),out(将单词和词频数按字典顺序输入到result.txt文件)
    测试运行
  • 程序的运行截图如下图:
    • 单词个数统计:
    • 词频统计:

代码片段

输入英文文本

排序

  • 展示PSP

任务内容 计划共完成需要的时间(min) 实际完成需要的时间(min)
计划 10 9.5
估计这个任务需要多少时间,并规划大致工作步骤 16 20
开发 200 230
需求分析 (包括学习新技术) 12 10
生成设计文档 12 15
设计复审 (和同事审核设计文档) 10 12
代码规范 (为目前的开发制定合适的规范) 10 12
具体设计 42 45
具体编码 120 130
代码复审 15 12
测试(自我测试,修改代码,提交修改) 30 40
报告 15 15
测试报告 6 6
计算工作量 5 3
事后总结 ,并提出过程改进计划 6 4
总结 本次项目对于java小白来说非常具有挑战了,在同学帮助下完成的不容易,大多数要求也未实现,在以后的学习中会更加努力的。编辑过程中问题很多,需要继续努力。
源码展示.
posted @ 2019-03-19 23:01  包稚潼  阅读(207)  评论(3编辑  收藏  举报