摘要: 有10000篇文章,每篇可能有0-10个标签,不同的标签共有1000个,用什么算法能最快地获取与指定文章相关度最高的其它文章? 用一个1000bit(归约为1024bit)数据类型来记录每篇文章包含了哪些标签,然后对这个数据进行与运算,以结果里出现的1的个数为标准排序即可。 规模大约为: 数据传输:1024bit=128Byte, 128Byte*10000=128B*10K=1MB(可以缓存,不是太大) 数据运算:比较次数为10000,每次比较1024bit。 得写个示例程序测试一下可行性。 using System; using System.Collections; using Syst 阅读全文