我们为什么不能只用O记号来谈论算法?

在刷LeetCode-1TwoSum的时候,有个人在论坛留言,大致意思如下:

我的算法击败了90%的人,O(nlgn)算法比O(n)算法快。

我觉得这个人是不懂算法的。让我一步一步解释。

 

# O的含义

通俗的说,O表示忽略系数的复杂度上限,常常用一个量级表示,比如n,nlgn。

 

# 忽略的系数重要吗

重要。我觉得《算法》比《算法导论》优秀的原因之一是,作者用实例证明,在不少情况下,复杂度之前的系数很重要。比如,系数可以导致O(n^2)的插入排序可以比O(nlgn)快速排序快。

可以看一个例子。

// 伪代码,程序1
void add(int num)
{
      num++;
      num++;
      num++;
      num++;
      num++;
      num++;
      num++;
      num++;
      num++;
      num++;
}

void add(int[] nums)
{
    for (int i = 0; i < n; i++)
        add(nums[i]);
}
// 伪代码,程序2
void add(int num)
{
      num++;
}

void add(int[] nums)
{
    for (int i = 0; i < n; i++)
        for (int j = 0; j < n; j++)
            add(nums[i]);
}

程序1的时间复杂度为O(n),程序2的时间复杂度为O(n^2)。如果从O来看,程序2的执行速度一定会比程序1快。

实际上速度相当。假设nums的大小为10,程序1要执行10 * 10 = 100次i++,程序2同样执行10 * 10 * 1 = 100次i++。

原因就在于,程序1需要的时间是10 * n,系数很大为10,而程序2需要的时间是1 * n ^ 2,系数很小为1。

 

# 那个人错在哪里

或许不是他的错,是LeetCode的错。

渐进时间一定要在系数相对于数据量比重很小很小的时候,才有用。像排序算法一类比较简单的算法,需要上十万的数据量,才能体现出复杂度为nlgn和n^2的细小区别。

这个人用了很聪明很简单的算法,没有用复杂的数据结构,全是基本变量,时间复杂度为O(nlgn)。而O(n)用了Hashtable,共有n个数,对于每个数,Hashtable里面有很多计算的过程,系数很大。

此题,LeetCode可能单个数据集不是很大,系数显得格外重要。

 

# 链接

Q: https://leetcode.com/problems/two-sum/

A: https://github.com/mofadeyunduo/LeetCode/tree/master/1TwoSum

(请多多支持我刚刚建立的GitHub和博客,谢谢,有问题可以邮件609092186@qq.com或者留言,我尽快回复)

 

posted @ 2016-08-07 23:24  Piers  阅读(436)  评论(0编辑  收藏  举报