江新宇

大数据的排序方法

题目:假设有100亿条数据,要取出前最小100条数据,要怎么去做呢?

 

方法是:用分布式排序算法,先把记录遍历,然后放入自定义的一个缓存区,每次从这个区域里取出最小值

去排序,我们可以选择一种比较简单的算法(二分法)。

posted @ 2010-08-14 14:35  新风宇宙-江新宇的博客  阅读(313)  评论(0编辑  收藏  举报