Linux设备驱动程序第三版学习（11）- 分配内存

一、kmalloc函数内幕
kmalloc的使用已经比较熟悉了，它的函数原型是：

   1:  #include <linux/slab.h>

   2:  void *kmalloc(size_t size, int flags);

其中size表示要分配的块的大小， flags是分配标志。下面分别详细说明这两个参数：
* size参数
实际上内核能分配的最小内存大小不是任意的，而是一些预定义的、固定大小的字节数组。linux创建一系列的内存对象池，每个池中的内存块大小事固定一致的。所以实际上申请到的内存大小可能会比size多一些，最多的时候会是2*size大小。另外，kmalloc能处理的最小内存块是32或64，取决于体系结构使用的页面大小。kmalloc不应该分配大于128KB的内存。
* flags参数
最常用的标志是GFP_KERNEL, GFP_ATOMIC。其次是__GFP_DMA和__GFP_HIGHMEM。其中GFP的意思就是get free page。GFP_KERNEL和GFP_ATOMIC的区别在于前者使用在进程上下文中，后者使用在进程上下文之外，例如中断上下文。所以前者可能在没有空闲内存时使进程休眠，而后者是不能休眠的。

二、后备高速缓存（lookaside cache）
linux高速缓存管理通过slab分配器来实现，通过slab实现的高速缓存具有kmem_cache_t类型。创建的函数如下，这个函数在２.6.32内核中和书中是不一样的，这里以2.6.32为准进行分析：

   1:  #include <linux/slab.h>

   2:  struct kmem_cache *kmem_cache_create (const char *name, size_t size, size_t align,　unsigned long flags,
　　　　　　　　　　　　　　　　　　　　　　　　　　　　 void (*ctor)(void *))

函数中各参数意义如下：
* name: 使用在/proc/slabinfo中用来识别这个高速缓存的字符串。在/proc目录下使用cat slabinfo可以查看现有的高速缓存。
* size: 在高速缓存中的每个内存对象的大小
* align: 确保已分配的对象进行某种特殊的对齐
* flags: 分配标志位。主要有以下位掩码（其中标志为DEBUG的只有在CONFIG_SLAB_DEBUG被设置才可用）：

   1:  #define SLAB_DEBUG_FREE        0x00000100UL    /* DEBUG: Perform (expensive) checks on free */

   2:  #define SLAB_RED_ZONE        0x00000400UL    /* DEBUG: Red zone objs in a cache */

   3:  #define SLAB_POISON        0x00000800UL    /* DEBUG: Poison objects */

   4:  #define SLAB_HWCACHE_ALIGN    0x00002000UL    /* Align objs on cache lines */

   5:  #define SLAB_CACHE_DMA        0x00004000UL    /* Use GFP_DMA memory */

   6:  #define SLAB_STORE_USER        0x00010000UL    /* DEBUG: Store the last owner for bug hunting */

   7:  #define SLAB_PANIC        0x00040000UL    /* Panic if kmem_cache_creat() fails*/

* ctor是内存对象的构造函数

高速缓存被创建完了以后，可以调用kmem_cache_alloc函数从中分配内存，释放一个内存对象则要调用kmem_cache_free函数。而释放一个高速缓存则要调用kmem_cache_destroy函数。注意这里高速缓存和内存对象的区别。另外还要注意的是：如果高速缓存中分配的内存对象还没有全部释放的情况下，此时释放高速缓存会失败，也就是会导致内存泄漏。所以设备驱动程序必须检查kmem_cache_destroy的返回状态。

三、get_free_page和相关函数
当需要分配大块内存时，不应该使用kmalloc，而应该使用get_free_page进行整页分配。相关函数如下：

   1:  get_zeroed_page(unsigned int flags); //分配一个页面，返回指向页面的指针，并将该页清零

   2:  __get_free_page(unsigned int flags); //分配一个页面，返回指向页面的指针，但不清零

   3:  __get_free_pages(unsigned int flags, unsigned int order); /*分配连续的页面，返回指向该内存区域的第一个字节的指针，不清零*/

释放内存页面的函数如下：

   1:  void free_page(unsigned long addr);

   2:  void free_pages(unsigned long addr, unsigned long order);

四、vmalloc及其辅助函数
vmalloc用来分配虚拟地址空间的连续区域，尽管物理上可能不连续，但是内核认为它们在地址上是连续的。相关函数如下：

   1:  #include <linux/vmalloc.h>

   2:  void *vmalloc(unsigned long size);

   3:  void vfree(void *addr);

   4:  void *ioremap(unsigned long offset, unsigned long size);

   5:  void iounmap(void *addr);

五、per-CPU变量，以下内容摘自http://blogold.chinaunix.net/u/12325/showart.php?id=1274548

1. 简介
   2.6内核的特性，每个处理器都拥有自己的变量副本。
2. 优势
   每个处理器访问自己的副本，无需加锁，可以放入自己的cache中，极大地提高了访问与更新效率。常用于计数器。
3. 使用
   相关头文件：<linux/percpu.h>
   (1) 编译期间分配
        声明：
        DEFINE_PER_CPU(type, name);
        避免进程在访问一个per-CPU变量时被切换到另外一个处理器上运行或被其它进程抢占：
          get_cpu_var(变量)++;
          put_cpu_var(变量);
        访问其他处理器的变量副本用这个宏：
          per_cpu(变量，int cpu_id);

   (2) 动态分配与释放
        动态分配per-CPU变量：
          void * alloc_percpu(type);
          void * __alloc_percpu(size_t size, size_t align); //可以做特定的内存对齐
        释放动态分配的per-CPU变量：
          free_percpu();
        访问动态分配的per-CPU变量的访问通过per_cpu_ptr完成：
          per_cpu_ptr(void * per_cpu_var, int cpu_id);

        要想阻塞抢占，使用get_cpu()与put_cpu()即可：
          int cpu = get_cpu();
          ptr = per_cpu_ptr(per_cpu_var, cpu);
          put_cpu();

   (3) 导出Per-CPU变量给模块
        EXPORT_PER_CPU_SYMBOL(per_cpu_var);
        EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var);

要在模块中访问这样一个变量，应该这样做声明：
DECLARE_PER_CPU(type, name);
4. 注意
在某些体系结构上，per-CPU变量可使用的地址空间是受限的，要尽量保持这些变量比较小。
5. Per-CPU变量的实现
每个CPU都有对应的专有的数据区，在start_kernel()中调用setup_per_cpu_areas()进行分配和初始化。通过数据区的首地址与偏移量信息访问Per-CPU变量。

posted on 2011-01-17 15:35 arm-linux 阅读(1160) 评论(0) 收藏举报

刷新页面返回顶部

arm-linux

公告

Linux设备驱动程序第三版学习（11）- 分配内存