题目:一个大的含有50M个URL的记录,一个小的含有500个URL的记录,找出两个记录里相同的URL。

 

第1种方法

首先使用包含500个url的文件创建一个hash_set。
然后遍历50M的url记录,如果url在hash_set中,则输出此url并从hash_set中删除这个url。
所有输出的url就是两个记录里相同的url。

 

第2种方法

AC自动机

posted on 2011-09-30 16:07  dartagnan  阅读(548)  评论(0编辑  收藏  举报