Lua函数执行流程及函数延续点问题的研究


第一:Lua函数调用的总体流程

     在保护性调用的情况下,lua中函数调用的流程如下,非保护性调用的流程更加简单,请追踪lua_call函数


int docall (lua_State *L, int narg, int nres) | —— int lua_pcallk (lua_State *L, int nargs, int nresults, int errfunc ...) | —— luaD_pcall (lua_State *L, Pfunc func, void *u,ptrdiff_t old_top, ptrdiff_t ef) | -- luaD_rawrunprotected (lua_State *L, Pfunc f, void *ud) | -- void f_call (lua_State *L, void *ud) | -- void luaD_call (lua_State *L, StkId func, int nResults, int allowyield) | -- int luaD_precall (lua_State *L, StkId func, int nresults) | -- luaD_poscall
|
---...

第二:函数调用的方式和异常处理

      可以看到 luaD_rawrunprotected 函数调用的实际上是 f_call,真正调用的函数在f_call中被调用,封装这一层的意义就是为了实现保护性调用。保护性调用的情况下lua虚拟机使用lua_longjmp为函数实现堆栈续传功能,也就是当错误发生的时候,在Lua内部能够最终跳转到调用点继续向下执行。所有使用luaD_rawrunprotected函数的的调用都不会因为错误直接导致程序退出,而是回到调用点然后将状态返回给外层逻辑处理。 

//保护性调用
int luaD_rawrunprotected (lua_State *L, Pfunc f, void *ud) {
  unsigned short oldnCcalls = L->nCcalls;
  struct lua_longjmp lj;
  lj.status = LUA_OK;
  lj.previous = L->errorJmp;  /* chain new error handler */
  L->errorJmp = &lj;
  LUAI_TRY(L, &lj,
    (*f)(L, ud); 当f函数调用出异常会回到这里继续向下走
  );
  L->errorJmp = lj.previous;  /* restore old error handler */
  L->nCcalls = oldnCcalls;
  return lj.status;
}

    对于Lua而言,只有LUA_YIELD是被视为可恢复的异常  #define errorstatus(s)  ((s) > LUA_YIELD),对于其他的错误就要报错了。

    其实对于调用一个函数,无论是lua函数还是c函数,可以使用lua_pacall(lua_call):这种方式的调用我们可以看到,在调用到 luaD_call 这个流程是,allowyield传的是0,也就是说是不允许挂起的,因此如果你在函数中如果使用了yield相关的函数试图挂起程序时候,再lua_yieldk中会报错:attempt to yield from outside a coroutine。因此我是不是可以理解为,如果你需要在函数中yield,就不能通过lua_pcall和lua_call的形式发起函数调用。当然还是有一种形式是使用lua_resume发起函数调用:我们知道resume的功能是唤醒一个挂起的线程(coroutine),当第一次调用的时候他只是简单的执行函数体,只有在之前有过yield挂起的记录之后再次调用resume才具备恢复线程的功能,这种方式是允许函数让出线程(yield挂起)的,下面会介绍到。

LUA_API int lua_yieldk (lua_State *L, int nresults, lua_KContext ctx,
                        lua_KFunction k) {
  CallInfo *ci = L->ci;
  luai_userstateyield(L, nresults);
  lua_lock(L);
  api_checknelems(L, nresults);
  if (L->nny > 0) {
    if (L != G(L)->mainthread)
      luaG_runerror(L, "attempt to yield across a C-call boundary");
    else
      luaG_runerror(L, "attempt to yield from outside a coroutine");  //这里报错!!
  }
  L->status = LUA_YIELD;
  ci->extra = savestack(L, ci->func);  /* save current 'func' */
  if (isLua(ci)) {  /* inside a hook? */
    api_check(L, k == NULL, "hooks cannot continue after yielding");
  }
  else {
    if ((ci->u.c.k = k) != NULL)  /* is there a continuation? */
      ci->u.c.ctx = ctx;  /* save context */
    ci->func = L->top - nresults - 1;  /* protect stack below results */
    luaD_throw(L, LUA_YIELD);
  }
  lua_assert(ci->callstatus & CIST_HOOKED);  /* must be inside a hook */
  lua_unlock(L);
  return 0;  /* return to 'luaD_hook' */
}

       归纳一下上面的内容:如果你调用的是不会挂起线程的函数体或者函数块,使用lua_pcall(lua_call)以及lua_resume都能够正常执行函数,如果函数体中含有挂起线程的流程,必须使用lua_resume发起函数调用。

 第三:函数调用的核心函数

      lua_precall是函数调用的前半部分,lua_postcall顾名思义对应函数调用的后半部分。如果调用的是C函数,那么在lua_precall中调整调整就直接调用了,然后直接调用lua_postcall函数调用就算结束了,然而如果是lua函数,需要交给lua虚拟机执行指令集调用,因此lua_precall只是将堆栈调整妥当,等到lvm执行完毕之后在执行lua_postcall,调整返回值。

 int luaD_precall (lua_State *L, StkId func, int nresults) {
   lua_CFunction f;
   CallInfo *ci;
   int n;  /* number of arguments (Lua) or returns (C) */
   ptrdiff_t funcr = savestack(L, func);
   switch (ttype(func)) {
     case LUA_TLCF:  /* light C function */
       f = fvalue(func);
       goto Cfunc;
     case LUA_TCCL: {  /* C closure */
       f = clCvalue(func)->f;
      Cfunc:
       luaC_checkGC(L);  /* stack grow uses memory */
       luaD_checkstack(L, LUA_MINSTACK);  /* ensure minimum stack size */
       ci = next_ci(L);  /* now 'enter' new function */  //新创建调用链,将调用信息录入
       ci->nresults = nresults;
       ci->func = restorestack(L, funcr);
       ci->top = L->top + LUA_MINSTACK;
       lua_assert(ci->top <= L->stack_last);
       ci->callstatus = 0;
       if (L->hookmask & LUA_MASKCALL)
         luaD_hook(L, LUA_HOOKCALL, -1);
       lua_unlock(L);
       n = (*f)(L);  /* do the actual call */    //如果是c闭包函数或者c函数,则直接调用
       lua_lock(L);
       api_checknelems(L, n);
       luaD_poscall(L, L->top - n, n);           //调整堆栈
       return 1;
     }
     case LUA_TLCL: {  /* Lua function: prepare its call */
       StkId base;
       Proto *p = clLvalue(func)->p;
       n = cast_int(L->top - func) - 1;  /* number of real arguments */
       luaC_checkGC(L);  /* stack grow uses memory */
       luaD_checkstack(L, p->maxstacksize);
       for (; n < p->numparams; n++) //如果函数定义的参数个数大于实际的参数个数,则用nil值补足 (可以看出来越靠后的参数越靠近栈顶部)
         setnilvalue(L->top++);  /* complete missing arguments */
       if (!p->is_vararg) {   //非缺省参数的函数 函数定义中不带 ...
         func = restorestack(L, funcr);
         base = func + 1;
       }
       else { //带缺省参数的函数,函数定义中带 ...
         base = adjust_varargs(L, p, n);
         func = restorestack(L, funcr);  /* previous call can change stack */
       }
       ci = next_ci(L);  /* now 'enter' new function */
       ci->nresults = nresults;
       ci->func = func;
       ci->u.l.base = base;
       ci->top = base + p->maxstacksize;
       lua_assert(ci->top <= L->stack_last);
       ci->u.l.savedpc = p->code;  /* starting point */
       ci->callstatus = CIST_LUA;
       L->top = ci->top;
       if (L->hookmask & LUA_MASKCALL)
         callhook(L, ci);
       return 0;
     }
     //元表驱动的函数调用,"call": 函数调用操作 func(args)。 当 Lua 尝试调用一个非函数的值的时候会触发这个事件 (即 func 不是一个函数)。 查找 func 的元方法, 如果找得到,就调用这个元方法, func 作为第一个参数传
 入,原来调用的参数(args)后依次排在后面。
     default: {  /* not a function */
       luaD_checkstack(L, 1);  /* ensure space for metamethod */
       func = restorestack(L, funcr);  /* previous call may change stack */
       tryfuncTM(L, func);  /* try to get '__call' metamethod */
       return luaD_precall(L, func, nresults);  /* now it must be a function */
     }
   }
 }                                                                                                                                                                                          

  lua_postcall主要是调整函数调用后的堆栈,特别是调整返回值和函数调用链,代码描述还是挺清楚的。

int luaD_poscall (lua_State *L, StkId firstResult, int nres) {
  StkId res;
  int wanted, i;
  CallInfo *ci = L->ci;
  if (L->hookmask & (LUA_MASKRET | LUA_MASKLINE)) {
    if (L->hookmask & LUA_MASKRET) {
      ptrdiff_t fr = savestack(L, firstResult);  /* hook may change stack */
      luaD_hook(L, LUA_HOOKRET, -1);
      firstResult = restorestack(L, fr);
    }
    L->oldpc = ci->previous->u.l.savedpc;  /* 'oldpc' for caller function */
  }
  res = ci->func;  /* res == final position of 1st result */
  wanted = ci->nresults;
  L->ci = ci->previous;  /* back to caller */
  /* move results to correct place */
  for (i = wanted; i != 0 && nres-- > 0; i--)
    setobjs2s(L, res++, firstResult++);
  while (i-- > 0)
    setnilvalue(res++);
  L->top = res;
  return (wanted - LUA_MULTRET);  /* 0 iff wanted == LUA_MULTRET */
}

  第四:关于续传函数的使用

     上面提到了lua中函数调用的异常处理,依赖于ljmp进行异常恢复,但是如果调用链中在c函数中挂起,那么再次使用lua_resume试图恢复调用栈的时候,C中的堆栈已经丢失了。通俗点讲就是:你在一个函数A中yield,函数B中第一次resume开始执行A函数,当遇到yield时候调用流程被打断,线程被挂起,当你再次调用resume的时候,你希望的是回到A函数中继续执行A在yield函数下面的代码段,但是这个是做不到的,因为C的堆栈在Lua虚拟机中已经无从查找了!因此lua提供了续点函数来间接处理这个难题,你可以在lua_pcallk或者lua_callk中传入一个k函数,也就是续点函数,当你的调用中某个yield被resume唤醒的时候,由于并不能够回到这个C函数中继续执行,但是他回到你提供的k函数,让你作为一个中间的跳板做一下事情!这就是续点函数。lua_pcallk和lua_callk函数不能在最外层调用的,还是上面提到的这个问题,最外层的函数调用如果不是用lua_resume发起的话就会出现上面提到的错误。其实这个也好理解,因为你的函数中含有yield相关的代码段,因此你的function就是allowyield的,但是通过lua_pcallk和lua_callk实际上调用的都是luaD_call不允许allowyield的版本。

LUA_API void lua_callk (lua_State *L, int nargs, int nresults,
                        lua_KContext ctx, lua_KFunction k) {
  StkId func;
  lua_lock(L);
  api_check(L, k == NULL || !isLua(L->ci),
    "cannot use continuations inside hooks");
  api_checknelems(L, nargs+1);
  api_check(L, L->status == LUA_OK, "cannot do calls on non-normal thread");
  checkresults(L, nargs, nresults);
  func = L->top - (nargs+1);
  if (k != NULL && L->nny == 0) {  /* need to prepare continuation? */
    L->ci->u.c.k = k;  /* save continuation */
    L->ci->u.c.ctx = ctx;  /* save context */
    luaD_call(L, func, nresults, 1);  /* do the call */  //yield版本
  }
  else  /* no continuation or no yieldable */
    luaD_call(L, func, nresults, 0);  /* just do the call */   //notyield版本
  adjustresults(L, nresults);
  lua_unlock(L);
}

  也许大家会有疑问,我传入了k函数,为什么不是调用yield版本,原因就在于L->nny这个值在luaState初始化的时候就不是0而是1,因此总会进noyield的版本。而用lua_resume的时候发起函数调用的时候,在lua_resume这个函数一开始就将L->nny重置为0,所以在lua_resume的外层保护下,lua_pcallk和luacallk能够顺利进入yield版本。   

//这里已经调整好参数和函数位置, p3,p2,p1,func.errfunc 为栈上从上而下的排布
LUA_API int lua_pcallk (lua_State *L, int nargs, int nresults, int errfunc,
                        lua_KContext ctx, lua_KFunction k) {
  struct CallS c;
  int status;
  ptrdiff_t func;
  lua_lock(L);
  api_check(L, k == NULL || !isLua(L->ci),
    "cannot use continuations inside hooks");
  api_checknelems(L, nargs+1);
  api_check(L, L->status == LUA_OK, "cannot do calls on non-normal thread");
  checkresults(L, nargs, nresults);
  if (errfunc == 0)
    func = 0;
  else {
    StkId o = index2addr(L, errfunc);
    api_checkstackindex(L, errfunc, o);
    func = savestack(L, o);
  }
  c.func = L->top - (nargs+1);  /* function to be called */  //指向函数位置
  if (k == NULL || L->nny > 0) {  /* no continuation or no yieldable? */
    c.nresults = nresults;  /* do a 'conventional' protected call */
    status = luaD_pcall(L, f_call, &c, savestack(L, c.func), func); //调用f_call
  }
  else {  /* prepare continuation (call is already protected by 'resume') */
    CallInfo *ci = L->ci;
    ci->u.c.k = k;  /* save continuation */
    ci->u.c.ctx = ctx;  /* save context */
    /* save information for error recovery */
    ci->extra = savestack(L, c.func);
    ci->u.c.old_errfunc = L->errfunc;
    L->errfunc = func;
    setoah(ci->callstatus, L->allowhook);  /* save value of 'allowhook' */
    ci->callstatus |= CIST_YPCALL;  /* function can do error recovery */
    luaD_call(L, c.func, nresults, 1);  /* do the call */
    ci->callstatus &= ~CIST_YPCALL;
    L->errfunc = ci->u.c.old_errfunc;
    status = LUA_OK;  /* if it is here, there were no errors */
  }
  adjustresults(L, nresults);
  lua_unlock(L);
  return status;
}

  下面是一个测试代码用于验证上面的结论,注释部分是不可运行因为外层直接使用lua_pcallk进行函数调用。

#include <stdio.h>
#include <string.h>
#include <lua.h>
#include <lauxlib.h>
#include <lualib.h>
#include <dlfcn.h>
#include <math.h>

static int cont(lua_State *L, int status, lua_KContext ctx) {
  printf("error occurred!!\n");
  return 0;
}

static int pcall_test(lua_State *L) {
  return lua_yield(L,0);
}

static int mytest(lua_State *L) {
  printf("mytest\n");
  lua_pushcfunction(L, pcall_test);
  int ret = lua_pcallk(L, 0, 0, 0, 0, cont);
  return 1;
}

int main(void) {
  lua_State *L = luaL_newstate();
  luaL_openlibs(L);
  lua_pushcfunction(L, mytest);

  //lua_pushcfunction(L, pcall_test);
  //lua_callk(L, 0, 0, 0, cont);
  /*if(ret != 0)
    {
    const char* err = luaL_checkstring(L, -1);
  //err : attempt to yield from outside a coroutine
  printf("%s\n", err);
  }*/

  //lua_resume(L, NULL, 0);

  int ret = lua_resume(L, NULL, 0);
  if((ret!=LUA_OK) && (ret!=LUA_YIELD))
  {
    const char* err = luaL_checkstring(L, -1);
    printf("%s\n", err);
    return;
  }
  ret = lua_resume(L, NULL, 0);
  
  lua_close(L);
  return 0;
} 

 

posted @ 2015-11-21 17:12  Orig  阅读(3110)  评论(0编辑  收藏  举报