摘要: 1,TF-IDF (Term Frequence - Inverse Document Frequency)这个算法用来评价一个词(Term)对整个文档的重要程度,它只考虑了两个因素:(1) 这个词条在本文档中出现的次数是否高 (2) 这个词在所有文档中出现的次数是否高。算法的思想很容易搞懂:在本文... 阅读全文
posted @ 2014-11-02 22:34 orchid 阅读(331) 评论(1) 推荐(0) 编辑
摘要: (1) 为何map和set的插入删除效率比用其他序列容器高?因为map和set的内部数据结构是红黑树,它的插入和删除不需做内存的拷贝和移动。(红黑树的插入和删除是log(n)的)。(2)为何每次insert之后,以前保存的iterator不会失效?iterator这里就相当于指向节点的指针,内存没有... 阅读全文
posted @ 2014-11-02 16:37 orchid 阅读(1329) 评论(0) 推荐(0) 编辑