个人项目总结---Liangjun

  个人项目的内容初始看着挺简单的,主要的内容就是统计词频,但是过程略微繁琐,当时主要原因是mentor那边也有个体力活,两边事情都不敢怠慢,导致这边的东西写了一半又转头去写那边的东西,一头乱麻。

  开始的设计是要使用Trie树去统计,然后C++因为没找到合适的API去查找系统的目录下文件名被我放弃了,当然我觉得两边都有push的结果就是都没有好结果。转头用了C#去做,然后用C#写了个一个Trie树,结果发现C#新生成的节点慢的要死,Trie的效率极其低下,前缀树的优势完全丧失,就导致我最后破罐子破摔直接用C#的STL了,先用map发现还是很慢,然后搜了一下,用了dictionary发现效果不错,接着在VS统计工具的帮助下改了一下中间词的组成方式(string的+效率也很低),发现时间到了30S,大概可以交作业了就交了。

  后面想想确实如果用C++的话,速度应该会很快,尤其是IO,当然我对C#的IO了解不多;另一方面就是虽然C++用了很多年,但是没有用它写工程项目,有些遗憾。其次是C#的改进空间还有挺多,当时时间也不多了,就草草了事了。感觉比较大的问题是时间分配的事情,即使两边都重要也是有侧重的,这次博客也是上次上课有别的事情耽误了,作业也没及时反馈疏于管理了。

posted @ 2012-09-08 23:58  Msra-Ustc-灰太狼  阅读(193)  评论(0编辑  收藏  举报