通过__block的作用深入研究block

block普通引用

默认情况下,在block中访问外部变量是通过复制一个变量来操作的,既可以读,但是写操作不对原变量生效,下面通过代码来举证

NSString *a = @"testa";
    NSLog(@"block前,a在堆中的地址%p,a在栈中的地址%p",a,&a);
    void(^testBlock)(void) = ^(void){
        NSLog(@"block内,a在堆中的地址%p,a在栈中的地址%p",a,&a);
    };
    NSLog(@"block后,a在堆中的地址%p,a在栈中的地址%p",a,&a);
    testBlock();

可以看出变量在堆中的地址其实是一直不变的,在栈中的地址,在block外是不变的,block内重新开辟了一个空间来存放。
那么来计算下两个地址变化
block前,a指向堆中的地址0x1000ec0b0,a在栈中的地址0x16fd19f58
block后,a指向堆中的地址0x1000ec0b0,a在栈中的地址0x16fd19f58
block内,a指向堆中的地址0x1000ec0b0,a在栈中的地址0x17404e0c0
十六进制的0x16fd19f58、0x17404e0c0转换为十进制数为,6170976088、6241444032。两者相差5546832956字节,再转换为MB为5289.8mb。已知IOS中一个进程的栈区内存只有1M,Mac也只有8M(等有空找官方文档求证下),又因为堆地址要小于栈地址,所以在block内调用变量,在不使用__block的情况下,是在堆中新建了一个变量地址指向原变量,block作用域结束则销毁,不影响原变量。

 

我们都知道:Block不允许修改外部变量的值,这里所说的外部变量的值,指的是栈中指针的内存地址。在block内调用变量,在不使用__block的情况下,是在堆中新建了一个变量地址指向原变量,block作用域结束则销毁,不影响原变量。

__block关键字

由前所知,通过__block修饰,block内部不仅仅可以对外部变量进行读操作,也可以进行写操作了,那这是为什么呢?同样用代码研究两者区别

__block NSString *a = @"testa";
    NSLog(@"block前,a指向堆中的地址%p,a在栈中的地址%p",a,&a);
    void(^testBlock)(void) = ^(void){
        NSLog(@"block内,a指向堆中的地址%p,a在栈中的地址%p",a,&a);
    };
    testBlock();
    NSLog(@"block后,a指向堆中的地址%p,a在栈中的地址%p",a,&a);

去掉时间戳后,打印的结果是

block前,a指向堆中的地址0x10007c0d0,a在栈中的地址0x16fd89f58
block内,a指向堆中的地址0x10007c0d0,a在栈中的地址0x1740533a8
block后,a指向堆中的地址0x10007c0d0,a在栈中的地址0x1740533a8

 

根据内存地址变化可见,__block所起到的作用就是只要观察到该变量被 block 所持有,就将“外部变量”在栈中的内存地址放到了堆中。进而在block内部也可以修改外部变量的值。原先地址是否直接抛弃不用再继续研究

Block不允许修改外部变量的值,Apple这样设计,应该是考虑到了block的特殊性,block也属于“函数”的范畴,变量进入block,实际就是已经改变了作用域。在几个作用域之间进行切换时,如果不加上这样的限制,变量的可维护性将大大降低。又比如我想在block内声明了一个与外部同名的变量,此时是允许呢还是不允许呢?只有加上了这样的限制,这样的情景才能实现。

编译器做了什么?

一般使用的话,到这个程度已经足够了。我们已经知道了加上__block关键字之后,编译器通过将外部变量同block一起copy到了堆区,并且将“外部变量”在栈中的内存地址改为了堆中的新地址。
如果多问一个为什么?编译器是怎么做到这样的呢?我们通过clang将 OC 代码转换为 C++ 文件:

clang -rewrite-objc 源代码文件名

转译的时候遇到了几个问题:

#import <UIKit/UIKit.h>
**        ^**
1 error generated.

通过Objective-C编译成C++代码报错文中的方式可以转译,但是又出现了新的问题;
2.clang: warning: using sysroot for 'iPhoneSimulator' but targeting 'MacOSX'
这个问题没能解决,然后换了个思路转译,
新代码如下

//坑爹的是NSLog都不能使用,不然会报NSLog错误。说白了还是工具不熟悉,为什么会出现这个情况都不清楚。有机会再看吧
int main() {
        int  a = 1;
        void(^testBlock)(void) = ^(void){
            
        };
        testBlock();
    
        __block int b = 2;
        void(^testBlockb)(void) = ^(void){
            b = 3;
        };
        testBlockb();
        return 0;
}

转译后代码如下

int main() {
        int a = 1;

        void(*testBlock)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
        ((void (*)(__block_impl *))((__block_impl *)testBlock)->FuncPtr)((__block_impl *)testBlock);





    __attribute__((__blocks__(byref))) __Block_byref_b_0 b = {(void*)0,(__Block_byref_b_0 *)&b, 0, sizeof(__Block_byref_b_0), 2};

        void(*testBlockb)(void) = ((void (*)())&__main_block_impl_1((void *)__main_block_func_1, &__main_block_desc_1_DATA, (__Block_byref_b_0 *)&b, 570425344));
        ((void (*)(__block_impl *))((__block_impl *)testBlockb)->FuncPtr)((__block_impl *)testBlockb);

        return 0;
}

代码变的很长很长,我们的目的是研究__block加上去之后编译器的操作,精简下就是

//加__block前的声明变量是这样的
int a = 1;
//加__block后的声明变量是这样的
__attribute__((__blocks__(byref))) __Block_byref_b_0 b = {
  (void*)0,
  (__Block_byref_b_0 *)&b, 
  0,
   sizeof(__Block_byref_b_0), 
  2};

可以看到增加了__block修饰之后,编译器做了不少工作,修饰词中有__Block_byref_b_0重复出现,这是一个与block一样的结构体类型的自动变量实例!!!!
此时我们在block内部访问val变量则需要通过一个叫__forwarding的成员变量来间接访问val变量。
讲__forwarding之前,需要先讨论一下block的存储域及copy操作。

1.Block的存储域及copy操作

前面提到,block内部的作用域是在堆上的,并且调用变量时会将变量copy到堆上,那么block本身是存储在堆上还是栈上呢?
我们先来看看一个由C/C++/OBJC编译的程序占用内存分布的结构:




实际上,block有三种类型,

  • 全局块(_NSConcreteGlobalBlock)
  • 栈块(_NSConcreteStackBlock)
  • 堆块(_NSConcreteMallocBlock)
    这三种block各自的存储域如下图:




  • 简而言之,存储在栈中的Block就是栈块、存储在堆中的就是堆块、既不在栈中也不在堆中的块就是全局块。(这听起来似乎与文章上半部分的说明有冲突呢?其实并不然)

那么,我们如何判断这个block的存储位置呢?
(1)Block不访问外界变量(包括栈中和堆中的变量)
Block 既不在栈又不在堆中,在代码段中,ARC和MRC下都是如此。此时为全局块。(_NSConcreteGlobalBlock)
(2)Block访问外界变量
MRC 环境下:访问外界变量的 Block 默认存储栈中。
ARC 环境下:访问外界变量的 Block 默认存储在堆中(实际是放在栈区,然后ARC情况下自动又拷贝到堆区),自动释放。

ARC下,访问外界变量的 Block为什么要自动从栈区拷贝到堆区呢?
栈上的Block,如果其所属的变量作用域结束,该Block就被废弃,如同一般的自动变量。当然,Block中的__block变量也同时被废弃。如下图:




为了解决栈块在其变量作用域结束之后被废弃(释放)的问题,我们需要把Block复制到堆中,延长其生命周期。开启ARC时,大多数情况下编译器会恰当地进行判断是否有需要将Block从栈复制到堆,如果有,自动生成将Block从栈上复制到堆上的代码。Block的复制操作执行的是copy实例方法。Block只要调用了copy方法,栈块就会变成堆块。
如下图:



在非ARC情况下则需要开发者调用copy方法手动复制,由于开发中几乎都是ARC模式,所以手动复制内容不再过多研究。
将Block从栈上复制到堆上相当消耗CPU,所以当Block设置在栈上也能够使用时,就不要复制了,因为此时的复制只是在浪费CPU资源。
Block的复制操作执行的是copy实例方法。不同类型的Block使用copy方法的效果如下表:


根据表得知,Block在堆中copy会造成引用计数增加,这与其他Objective-C对象是一样的。虽然Block在栈中也是以对象的身份存在,但是栈块没有引用计数,因为不需要,我们都知道栈区的内存由编译器自动分配释放。
不管Block存储域在何处,用copy方法复制都不会引起任何问题。在不确定时调用copy方法即可。

在ARC有效时,多次调用copy方法完全没有问题:

blk = [[[[blk copy] copy] copy] copy];
// 经过多次复制,变量blk仍然持有Block的强引用,该Block不会被废弃。
2.__block变量与__forwarding

在copy操作之后,既然__block变量也被copy到堆上去了, 那么访问该变量是访问栈上的还是堆上的呢?__forwarding 终于要闪亮登场了,如下图:

通过__forwarding, 无论是在block中还是 block外访问__block变量, 也不管该变量在栈上或堆上, 都能顺利地访问同一个__block变量。
值得注意的是,在ARC下,使用 __block 也有可能带来的循环引用,

本文非原创,仅用来学习总结记录用,参考文章:
1.iOS中__block 关键字的底层实现原理
2.iOS Block详解
3.Objective-C中的Block

 
 
 
 
posted @ 2018-03-07 10:11  FMDN  阅读(1714)  评论(0编辑  收藏  举报