个人项目总结 By 钟华平
这一次的个人项目虽然看上去比较简单,但是要做好并不容易,有许多细节的地方值得我们去注意。比如在对输入数据进行划分时,比较容易想到的做法就是通过正则表达式,使用String.Split方法完成,但是如果自己简单地实现一个划词算法(枚举输入数据的每一个字符,判断其是否为英文字母),程序的时间效率将得到很大的提高。
除此之外,数据结构的设计、排序算法的实现都将对程序的效率产生很大的影响。以前自己在写程序的时候,并没有过多地关注这些细节,都是随随便便写个程序,把结果跑出来就算了。以后在写程序的时候,一定要改掉这个坏毛病,不要为了写程序而写程序,而是要把写程序看成是一门艺术。
由于本次实验一开始要求处理的数据大小可能达到10G,超出了一般计算机的内存容量,所以一开始自己是想通过外部排序的算法实现。后来经过老师的确认后,虽然所有文件的大小总和可能达到10G,但是不同单词的总数不会那么大,所以直接在内存中进行处理即可。
在完成本次个人项目的过程中,自己不仅仅学到了如何使用Visual Studio的性能分析工具,同时也深深地体会到了单元测试、回归测试等技术的重要性。通过本次实验和上次邮件地址的验证实验,我对单元测试有了更加深入的了解和认识:单元测试是程序员在编写代码时,验证代码正确性的重要技术,我们应该在编写代码的同时便设计单元测试进行验证,而不是在代码编写完成后再进行单元测试。
posted on 2012-09-06 19:10 Gun N' Rose 阅读(217) 评论(2) 编辑 收藏 举报