附加作业－堆和栈

本次作业要探讨堆和栈的性质，为了严格起见，先说明下我这里的软件环境：

操作系统：OS X 10.9

编译器：CLANG & LLVM 3.3

先说内存占用部分：

由于我的编程能力弱爆了，只会写最简单的程序，并且各种规范都没有注意。于是我就写了如下程序来考察栈对于内存的使用：

#include <stdlib.h>
void foo()
{
  int a, b;
  a = 1;
  b = a;
}

int main()
{
  int i;
  while (1) {
    foo();
  }
  return 0;
}

这段程序就在做一个很无聊的事情，不断申请空间。。。但是由于栈会自动回退，所以内存占用比较良好：

然后弱爆了的我为了测试堆的内存占用，写出了如下代码：

#include <stdlib.h>
int foo()
{
  int a, *b;
  a = 1;
  b = malloc(sizeof(int));
  *b = a;
  return *b;
}

int main()
{
  int i;
  while (1) {
    foo();
  }
  return 0;
}

有一点需要注意，这里返回值是传的值，不是指针，所以输出的结果也是正确的。可是。。。：

刚开没多久，就占了3.29G的内存。由于比较吓人，我就把这个程序关了。我测试过一次用了5.9G，后来怕电脑爆内存，就干掉进程了（爆内存意味着比较彻底的死机）。

后来我又测试了一下，这次在编译的时候，我用开了编译器的优化功能

gcc -O2 heapMemoryOccupy.c

这次执行的时候内存就很合理了：

这个现象引起了我的好奇，果断从汇编入手（*nix和win有objdump，mac是otool），以下为不加优化的程序：

heapMemoryOccupy.o:
(__TEXT,__text) section
_foo:
0000000000000000    pushq    %rbp
0000000000000001    movq    %rsp, %rbp
0000000000000004    subq    $0x10, %rsp
0000000000000008    movabsq    $0x4, %rdi
0000000000000012    movl    $0x1, 0xfffffffffffffffc(%rbp)
0000000000000019    callq    0x1e
000000000000001e    movq    %rax, 0xfffffffffffffff0(%rbp)
0000000000000022    movl    0xfffffffffffffffc(%rbp), %ecx
0000000000000025    movq    0xfffffffffffffff0(%rbp), %rax
0000000000000029    movl    %ecx, (%rax)
000000000000002b    movq    0xfffffffffffffff0(%rbp), %rax
000000000000002f    movl    (%rax), %eax
0000000000000031    addq    $0x10, %rsp
0000000000000035    popq    %rbp
0000000000000036    ret
0000000000000037    nopw    (%rax,%rax)
_main:
0000000000000040    pushq    %rbp
0000000000000041    movq    %rsp, %rbp
0000000000000044    subq    $0x10, %rsp
0000000000000048    movl    $0x0, 0xfffffffffffffffc(%rbp)
000000000000004f    callq    0x54
0000000000000054    movl    %eax, 0xfffffffffffffff4(%rbp)
0000000000000057    jmpq    0x4f

以下为加了优化的程序:

heapMemoryOccupy.o:
(__TEXT,__text) section
_foo:
0000000000000000    pushq    %rbp
0000000000000001    movq    %rsp, %rbp
0000000000000004    movl    $0x1, %eax
0000000000000009    popq    %rbp
000000000000000a    ret
000000000000000b    nopl    (%rax,%rax)
_main:
0000000000000010    pushq    %rbp
0000000000000011    movq    %rsp, %rbp
0000000000000014    nopw    %cs:(%rax,%rax)
0000000000000020    jmp    0x20

编译器优化的原则是：在不改变结果的情况下尽可能给程序提速。不过这个结果确实令我感到震惊，直接根据语义，把malloc函数给优化掉了。看来我们的编译原理课上讲的东西还是太弱了。

关于运行速度：

由于某种机缘巧合，我的编程能力突然提高了，注意到了可能产生的内存泄漏，于是写出了下面两端代码，测试在保证正确性情况下堆和栈的速度：

先是栈：

#include <stdlib.h>
void foo()
{
  int a, b;
  a = 1;
  b = a;
}

int main()
{
  long i = 1e9;
  while ((i--)>0) {
    foo();
  }
  return 0;
}

运行速度：

然后是堆，代码：

#include <stdlib.h>
void foo()
{
  int a, *b;
  a = 1;
  b = malloc(sizeof(int));
  *b = a;
  free(b);
}

int main()
{
  int i = 1e9;
  while ((i--) > 0) {
    foo();
  }
  return 0;
}

下面是速度：（测试的时候还一度怀疑能不能出结果了）

由此可见，由于申请和释放的开销，局部变量还是用栈比较好。

栈的不足之处，传说中的栈溢出（stack overflow）：

由于蛋疼，我写了如下代码：

#include <stdio.h>
void foo(int a)
{
  printf("%d\n", a);
  foo(a+1);
}
int main()
{
  foo(1);
  return 0;
}

这个就是一个无限递归，然后我们看它的结果：

由此可见，只要262008个最简单的递归，栈就溢出了，由此可以算出栈大约就是几兆的空间。

也由此告诉我们，由于各种限制，尽量少用递归比较好。不过，我又发现，开了优化参数以后，由于代码的优化，跑了很久都没栈溢出。。。

堆的另一个问题：指针悬挂

内存泄漏是众所周知，我们的第二段代码就是一个典型的内存泄漏，从截图可以看出，泄漏了将近4G内存（囧TL）。下面我来演示以下指针悬挂：

#include <stdlib.h>
#include <stdio.h>
int main()
{
  int *i, *j;
  float *f;
  i = malloc(sizeof(int));
  *i = 1;
  j = i;
  printf("*j=%d\n", *j);
  free(i);
  f = malloc(sizeof(float));
  *f = 0.5;
  printf("*j=%d\n", *j);
  return 0;
}

这里的亮点在于，j的位置后来变成了一个浮点数，以下是运行结果：

这是mac系统下的结果，在别的系统就不能保证了。由此得出的结论也很简单，这是要避免的情况。

指针是c语言的一大迷人的地方，指针用的犀利，程序也就很犀利。指针用萎了程序也就萎了。以上总结的都是我血泪教训，分享给大家，希望能够共同进步。

posted on 2013-12-09 01:10 不想嚣张阅读(533) 评论(0) 收藏举报

刷新页面返回顶部

附加作业－堆和栈

导航

公告