[Cocoa]深入浅出Cocoa多线程编程之block与dispatch quene

深入浅出Cocoa多线程编程之block与dispatch quene

block 是 Apple 在 GCC 4.2 中扩充的新语法特性，其目的是支持多核并行编程。我们可以将 dispatch_queue 与 block 结合起来使用，方便进行多线程编程。

本文源代码下载：点击下载

1，实验工程准备
在 XCode 4.0 中，我们建立一个 Mac OS X Application 类型的 Command Line Tool，在 Type 里面我们选择 Foundation 就好，工程名字暂且为 StudyBlocks.默认生成的工程代码 main.m 内容如下：

int main (int argc, const char * argv[])
{
NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init];

// insert code here...
NSLog(@"Hello, World!");

[pool drain];
return 0;
}

2，如何编写 block

在自动生成的工程代码中，默认打印一条语句"Hello, World!"，这个任务可以不可以用 block 语法来实现呢？答案是肯定的，请看：

void (^aBlock)(void) = ^(void){ NSLog(@"Hello, World!"); };
aBlock();

用上面的这两行语句替换 main.m 中的 NSLog(@"Hello, World!"); 语句，编译运行，结果是一样的。

这两行语句是什么意思呢？首先，等号左边的 void (^aBlock)(void) 表示声明了一个 block，这个 block 不带参数(void)且也无返回参数(void)；等号右边的 ^(void){ } 结构表示一个 block 的实现体，至于这个 block 具体要做的事情就都在 {} 之间了。在这里我们仅仅是打印一条语句。整个语句就是声明一个 block，并对其赋值。第二个语句就是调用这个 block 做实际的事情，就像我们调用函数一样。block 很有点像 C++0X 中的 Lambda 表达式。

我们也可以这么写：

void (^aBlock)(void) = 0;
aBlock = ^(void){
NSLog(@" >> Hello, World!");
};
aBlock();

现在我们知道了一个 block 该如何编写了，那么 block 数组呢？也很简单，请看：

void (^blocks[2])(void) = {
^(void){ NSLog(@" >> This is block 1!"); },
^(void){ NSLog(@" >> This is block 2!"); }
};

blocks[0]();
blocks[1]();

谨记！

block 是分配在 stack 上的，这意味着我们必须小心里处理 block 的生命周期。
比如如下的做法是不对的，因为 stack 分配的 block 在 if 或 else 内是有效的，但是到大括号 } 退出时就可能无效了：

dispatch_block_t block;

if (x) {
block = ^{ printf("true\n"); };
} else {
block = ^{ printf("false\n"); };
}
block();

上面的代码就相当于下面这样的 unsafe 代码：

if (x) {
struct Block __tmp_1 = ...; // setup details
block = &__tmp_1;
} else {
struct Block __tmp_2 = ...; // setup details
block = &__tmp_2;
}

3，如何在 block 中修改外部变量

考虑到 block 的目的是为了支持并行编程，对于普通的 local 变量，我们就不能在 block 里面随意修改（原因很简单，block 可以被多个线程并行运行，会有问题的），而且如果你在 block 中修改普通的 local 变量，编译器也会报错。那么该如何修改外部变量呢？有两种办法，第一种是可以修改 static 全局变量；第二种是可以修改用新关键字 __block 修饰的变量。请看：

__block int blockLocal = 100;
static int staticLocal = 100;

void (^aBlock)(void) = ^(void){
NSLog(@" >> Sum: %d\n", global + staticLocal);

global++;
blockLocal++;
staticLocal++;
};

aBlock();

NSLog(@"After modified, global: %d, block local: %d, static local: %d\n", global, blockLocal, staticLocal);

相似的情况，我们也可以引用 static block 或 __block block。比如我们可以用他们来实现 block 递归：

// 1
void (^aBlock)(int) = 0;
static void (^ const staticBlock)(int) = ^(int i) {
if (i > 0) {
NSLog(@" >> static %d", i);
staticBlock(i - 1);
}
};

aBlock = staticBlock;
aBlock(5);

// 2
__block void (^blockBlock)(int);
blockBlock = ^(int i) {
if (i > 0) {
NSLog(@" >> block %d", i);
blockBlock(i - 1);
}
};

blockBlock(5);

4，上面我们介绍了 block 及其基本用法，但还没有涉及并行编程。

block 与 Dispatch Queue 分发队列结合起来使用，是 iOS 中并行编程的利器。请看代码：

NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init];

initData();

// create dispatch queue
//
dispatch_queue_t queue = dispatch_queue_create("StudyBlocks", NULL);

dispatch_async(queue, ^(void) {
int sum = 0;
for(int i = 0; i < Length; i++)
sum += data[i];

NSLog(@" >> Sum: %d", sum);

flag = YES;
});

// wait util work is done.
//
while (!flag);
dispatch_release(queue);

[pool drain];

上面的 block 仅仅是将数组求和。首先，我们创建一个串行分发队列，然后将一个 block 任务加入到其中并行运行，这样 block 就会在新的线程中运行，直到结束返回主线程。在这里要注意 flag 的使用。flag 是 static 的，所以我们可以 block 中修改它。语句 while (!flag); 的目的是保证主线程不会 blcok 所在线程之前结束。

dispatch_queue_t 的定义如下：

typedef void (^dispatch_block_t)( void);

这意味着加入 dispatch_queue 中的 block 必须是无参数也无返回值的。

dispatch_queue_create 的定义如下：

dispatch_queue_t dispatch_queue_create(const char *label, dispatch_queue_attr_t attr);

这个函数带有两个参数：一个用于标识 dispatch_queue 的字符串；一个是保留的 dispatch_queue 属性，将其设置为 NULL 即可。

我们也可以使用

dispatch_queue_t dispatch_get_global_queue(long priority, unsigned long flags);

来获得全局的 dispatch_queue，参数 priority 表示优先级，值得注意的是：我们不能修改该函数返回的 dispatch_queue。

dispatch_async 函数的定义如下：

void dispatch_async(dispatch_queue_t queue, dispatch_block_t block);

它是将一个 block 加入一个 dispatch_queue，这个 block 会再其后得到调度时，并行运行。
相应的 dispatch_sync 函数就是同步执行了，一般很少用到。比如上面的代码如果我们修改为 dispatch_sync，那么就无需编写 flag 同步代码了。

5，dispatch_queue 的运作机制及线程间同步

我们可以将许多 blocks 用 dispatch_async 函数提交到到 dispatch_queue 串行运行。这些 blocks 是按照 FIFO(先入先出)规则调度的，也就是说，先加入的先执行，后加入的一定后执行，但在某一个时刻，可能有多个 block 同时在执行。

在上面的例子中，我们的主线程一直在轮询 flag 以便知晓 block 线程是否执行完毕，这样做的效率是很低的，严重浪费 CPU 资源。我们可以使用一些通信机制来解决这个问题，如：semaphore（信号量）。 semaphore 的原理很简单，就是生产-消费模式，必须生产一些资源才能消费，没有资源的时候，那我就啥也不干，直到资源就绪。下面来看代码：

NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init];

initData();

// Create a semaphore with 0 resource
//
__block dispatch_semaphore_t sem = dispatch_semaphore_create(0);

// create dispatch semaphore
//
dispatch_queue_t queue = dispatch_queue_create("StudyBlocks", NULL);

dispatch_async(queue, ^(void) {
int sum = 0;
for(int i = 0; i < Length; i++)
sum += data[i];

NSLog(@" >> Sum: %d", sum);

// signal the semaphore: add 1 resource
//
dispatch_semaphore_signal(sem);
});

// wait for the semaphore: wait until resource is ready.
//
dispatch_semaphore_wait(sem, DISPATCH_TIME_FOREVER);

dispatch_release(sem);
dispatch_release(queue);

[pool drain];

首先我们创建一个 __block semaphore，并将其资源初始值设置为 0 (不能少于 0)，在这里表示任务还没有完成，没有资源可用主线程不要做事情。然后在 block 任务完成之后，使用 dispatch_semaphore_signal 增加 semaphore 计数（可理解为资源数），表明任务完成，有资源可用主线程可以做事情了。而主线程中的 dispatch_semaphore_wait 就是减少 semaphore 的计数，如果资源数少于 0，则表明资源还可不得，我得按照FIFO（先等先得）的规则等待资源就绪，一旦资源就绪并且得到调度了，我再执行。

6 示例：

下面我们来看一个按照 FIFO 顺序执行并用 semaphore 同步的例子：先将数组求和再依次减去数组。

NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init];

initData();

__block int sum = 0;

// Create a semaphore with 0 resource
//
__block dispatch_semaphore_t sem = dispatch_semaphore_create(0);
__block dispatch_semaphore_t taskSem = dispatch_semaphore_create(0);

// create dispatch semaphore
//
dispatch_queue_t queue = dispatch_queue_create("StudyBlocks", NULL);

dispatch_block_t task1 = ^(void) {
int s = 0;
for (int i = 0; i < Length; i++)
s += data[i];
sum = s;

NSLog(@" >> after add: %d", sum);

dispatch_semaphore_signal(taskSem);
};

dispatch_block_t task2 = ^(void) {
dispatch_semaphore_wait(taskSem, DISPATCH_TIME_FOREVER);

int s = sum;
for (int i = 0; i < Length; i++)
s -= data[i];
sum = s;

NSLog(@" >> after subtract: %d", sum);
dispatch_semaphore_signal(sem);
};

dispatch_async(queue, task1);
dispatch_async(queue, task2);

// wait for the semaphore: wait until resource is ready.
//
dispatch_semaphore_wait(sem, DISPATCH_TIME_FOREVER);

dispatch_release(taskSem);
dispatch_release(sem);
dispatch_release(queue);

[pool drain];

在上面的代码中，我们利用了 dispatch_queue 的 FIFO 特性，确保 task1 先于 task2 执行，而 task2 必须等待直到 task1 执行完毕才开始干正事，主线程又必须等待 task2 才能干正事。这样我们就可以保证先求和，再相减，然后再让主线程运行结束这个顺序。

7，使用 dispatch_apply 进行并发迭代：
对于上面的求和操作，我们也可以使用 dispatch_apply 来简化代码的编写：

NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init];

initData();

dispatch_queue_t queue = dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0);

__block int sum = 0;
__block int *pArray = data;

// iterations
//
dispatch_apply(Length, queue, ^(size_t i) {
sum += pArray[i];
});

NSLog(@" >> sum: %d", sum);

dispatch_release(queue);

[pool drain];

注意这里使用了全局 dispatch_queue。

dispatch_apply 的定义如下：

dispatch_apply(size_t iterations, dispatch_queue_t queue, void (^block)(size_t));

参数 iterations 表示迭代的次数，void (^block)(size_t) 是 block 循环体。这么做与 for 循环相比有什么好处呢？答案是：并行，这里的求和是并行的，并不是按照顺序依次执行求和的。

8, dispatch group

我们可以将完成一组相关任务的 block 添加到一个 dispatch group 中去，这样可以在 group 中所有 block 任务都完成之后，再做其他事情。比如 6 中的示例也可以使用 dispatch group 实现：

NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init];

initData();

__block int sum = 0;

// Create a semaphore with 0 resource
//
__block dispatch_semaphore_t taskSem = dispatch_semaphore_create(0);

// create dispatch semaphore
//
dispatch_queue_t queue = dispatch_queue_create("StudyBlocks", NULL);
dispatch_group_t group = dispatch_group_create();

dispatch_block_t task1 = ^(void) {
int s = 0;
for (int i = 0; i < Length; i++)
s += data[i];
sum = s;

NSLog(@" >> after add: %d", sum);

dispatch_semaphore_signal(taskSem);
};

dispatch_block_t task2 = ^(void) {
dispatch_semaphore_wait(taskSem, DISPATCH_TIME_FOREVER);

int s = sum;
for (int i = 0; i < Length; i++)
s -= data[i];
sum = s;

NSLog(@" >> after subtract: %d", sum);
};

// Fork
dispatch_group_async(group, queue, task1);
dispatch_group_async(group, queue, task2);

// Join
dispatch_group_wait(group, DISPATCH_TIME_FOREVER);

dispatch_release(taskSem);
dispatch_release(queue);
dispatch_release(group);

[pool drain];

在上面的代码中，我们使用 dispatch_group_create 创建一个 dispatch_group_t，然后使用语句：dispatch_group_async(group, queue, task1); 将 block 任务加入队列中，并与组关联，这样我们就可以使用 dispatch_group_wait(group, DISPATCH_TIME_FOREVER); 来等待组中所有的 block 任务完成再继续执行。

至此我们了解了 dispatch queue 以及 block 并行编程相关基本知识，开始在项目中运用它们吧，

参考资料：
Concurrency Programming Guide：

http://developer.apple.com/library/ios/#documentation/General/Conceptual/ConcurrencyProgrammingGuide/Introduction/Introduction.html