摘要: 个人项目的内容初始看着挺简单的,主要的内容就是统计词频,但是过程略微繁琐,当时主要原因是mentor那边也有个体力活,两边事情都不敢怠慢,导致这边的东西写了一半又转头去写那边的东西,一头乱麻。 开始的设计是要使用Trie树去统计,然后C++因为没找到合适的API去查找系统的目录下文件名被我放弃了,当然我觉得两边都有push的结果就是都没有好结果。转头用了C#去做,然后用C#写了个一个Trie树,结果发现C#新生成的节点慢的要死,Trie的效率极其低下,前缀树的优势完全丧失,就导致我最后破罐子破摔直接用C#的STL了,先用map发现还是很慢,然后搜了一下,用了dictionary发现效果不... 阅读全文
posted @ 2012-09-08 23:58 Msra-Ustc-灰太狼 阅读(193) 评论(0) 推荐(0) 编辑