Individual Project - Word frequency program
第一次软件工程作业,要写个词频统计。鉴于之前(包括现在)还不太会C#,开始以为写起来会很困难,实际操作并没有开始想的那没困难,虽然也不是那么轻松。
在开始工作之前估计是用时间是大概整个一周??其实觉得估计用时对我这样的C#新手来说意义不大,因为只要我愿意查看某个比较陌生的特性,要花多久都是可能的(只要我觉得会比较有意思就可以了);相反,如果只是应付作业,不会的地方问下人,不求甚解的话,大概很快就能完成吧。
至于实际用时吗。。我想说装VS2012会费时最多(笑),我装的时候总是出错,装了很久很久。也有不少同学在安装上也出现了各种各样的问题,不过现在想来,虽然老师要求用VS2012,还是没必要在这上面费时太多,毕竟只是工具而已,更重要的是程序员本身。真正写代码的时间大概有5个小时吧,不过算上动手之前看书的时间的话就远不止了。
(关于性能分析,很惭愧的说我并没花多少时间,截图需要大的样例,暂时还没有(只是很小的例子),白天再上图吧。)
現在上圖如下,不過性能改進方案還沒有太多考慮,中午就根據新的要求改了一下程序(雖然只有變了兩個正則表達式和一個輸出路徑),性能分析如下:
这是一个较小的样本:
下面是一个比较大的样本,没有全分析完:
这个分析就比较有说服力了,不过性能貌似就不太好了。
关于样例的选择,我是从以下的方面考虑的:1.空目录的存在;2.边界值(只有3个字符的);3.诸如abc9d99等中间有数字的扩展模式;4.快捷方式的存在;5.以数字开头的单词;6.超大文件读取。
最后,学到的东西有不少吧,各种各样的用法还有概念,尤其是正則匹配的相關內容。只是还有些问题没解决,就是我在一个样例中建立了一个txt文本的快捷方式(指向本文件夹内的没有试过,因为如果那样我也不知道怎样才算正确了。。),但是读到的东西就很奇怪了,现在还没搞明白是怎么回事,希望有懂的人可以指教一下,谢过。