【翻译】JavaScript中的作用域和声明提前

原文:http://www.adequatelygood.com/JavaScript-Scoping-and-Hoisting.html

===翻译开始===

你知道下面的JavaScript脚本执行结果是什么吗?

1 var foo=1;
2 function bar(){
3     if(!foo){
4         var foo=10;
5     }
6     alert(foo);
7 }
8 bar();

如果你对弹出的结果是"10"感到惊讶的话,那么下面这段脚本会让你晕头转向的:

1 var a=1;
2 function b(){
3     a=10;
4     return ;
5     function a(){};
6 }
7 b();
8 alert(a);

浏览器会弹出"1",这到底是怎么回事呢?这看起来很奇怪,事实上这恰好是语言的一个强大而又富有表现力的特性。我不知道这种特别的行为是否有一个标准的命名,但我喜欢把它叫做"hoisting"。接下来我会试着分析一下这种机制,但是我们有必要先理解一下JavaScript的作用域。

JavaScript中的作用域

对于JavaScript初学者来说,作用域常让他们感到困惑。事实上,一些资深的JavaScript开发者也不是完全理解作用域。JavaScript的作用域之所以让人如此困惑,因为它跟C系语言有点相似,请看下面的C程序:

 1 #include <stdio.h>
 2 int main(){
 3     int x=1;
 4     printf("%d\n",x);//1
 5     if(1){
 6         int x=2;
 7         printf("%d\n",x);//2
 8     }
 9     printf("%d\n",x);//1
10 }

程序会依次输出1,2,1,这是因为C系语言有块级作用域。当程序运行到一个程序块的时候(比如if语句),在该程序块里定义的新变量不会影响到外部作用域。但在JavsScript中却不相同,试着执行下面的脚本:

1 var x=1;
2 console.log(x);//1
3 if(true){
4     var x=2;
5     console.log(x);//2
6 }
7 console.log(x);//2

脚本执行后会依次输出1,2,2,这是因为JavsScript只有函数级作用域,这和C系语言有着根本的不同,程序块(比如if语句)是不会创建新的作用域的,只有函数才会。

对于一些使用C、C++、C#或者Java语言的开发者来说,这简直让人难以接受。还好JavaScript的函数足够灵活,可以用其它变通方法。如果你一定要在函数内创建一个临时的作用域,可以这样做:

 1 function foo(){
 2     var x=1;
 3     if(x){
 4         (function(){
 5             var x=2;
 6             //some other code
 7         }());
 8     }
 9     //x is still 1.
10 }

这个方法相当灵活,在任何需要的地方都可以使用,不止在块语句里。但是我强烈建议你花一些时间来真正理解和欣赏JavaScript的作用域,这是我最喜欢的语言特性之一,它真的非常强大。如果你理解了作用域,那么对于声明提前你会更容易理解。

声明,变量名,声明提前

在JavaScript中,一个变量可以通过以下四种方式之一进入作用域:

1、语言内置:所有作用域都默认包含"this"和"arguments"变量。
2、函数形参:函数可以拥有形参,所属作用域就是该函数体。
3、函数声明:形如"function foo(){}"的声明。
4、变量声明:形如"var foo;"的声明。

函数声明和变量声明总会被JavaScript解释器自动放到所属作用域的顶端,函数参数和语言内置的变量默认都是在最顶端。举个例子,有如下代码:

1 function foo(){
2     bar();
3     var x=1;
4 }

被解析器解析后变为:

1 function foo(){
2     var x;
3     bar();
4     x=1;
5 }

这说明了,无论声明语句放在哪里都会被执行,比如说下面两个函数,它们是相等的:

 1 function foo(){
 2     if(false){
 3         var x=1;
 4     }
 5     return;
 6     var y=1;
 7 }
 8 
 9 function foo(){
10     var x,y;
11     if(false){
12         x=1;
13     }
14     return;
15     y=1;
16 }

要注意的是,有时声明和赋值会写在一起,但是赋值部分并没有被提前,只有声明被提前了。函数声明就有些特别了,整个函数体也会被提前。但是不要忘了函数声明有两种方式,请看下面的代码:

 1 function test(){
 2     foo(); //TypeError "foo is not a function"
 3     bar(); //"this will run!"
 4     var foo=function(){ //function expression assigned to local variable "foo"
 5         alert('this won't run!');
 6     };
 7     function bar(){//function declaration,given the name 
 8         alert('this will run!');
 9     }
10 }
11 test();

在这个例子里,只有使用函数声明的函数体会被提前至顶端,而使用函数表达式赋值方式,只有名字"foo"被提前至顶端,函数体是没有的。

上面的例子基本覆盖了自动提前的情况,看起来并不是那么复杂让人迷惑。当然,一些其它比较特别的例子还是有一些复杂的。

变量识别顺序

我们要特别记住变量的识别顺序,前面说过变量名进入作用域有四种方式,我上面列举的顺序就是它们被识别的顺序。通常,如果一个变量名已经定义了,那么它就不会被其它相同名称的变量所覆盖。这意味着函数声明比变量声明优先级高,但这并不影响赋值操作,只是声明部分会被忽略而已。

PS:补充一段代码,表达作者的意思

function foo(){}
var foo=3;
console.log(foo);//3

这段代码会被解析为:
function foo(){}
//var foo; //这条语句就被忽略了
foo=3;
console.log(foo);

依我理解是这样子:
var foo;
foo=function foo(){}
foo=3;
console.log(foo);

接着原文,以下是几种特别情况:

1、内置的变量"arguments"表现比较奇怪,它好像定义在函数形参和函数声明之间。这意味着如果形参中有个变量为"arguments",那么它的优先级将高于内置的"arguments",即使它是undefined。这不是一个好的特性,不要使用"arguments"作为形参变量名。
2、使用"this"作为一个标识符会引起语法错误,这是一个好的特性。
3、如果多个形参中出现同名,那么最后一个将拥有最高的优先级,即使它是undefined。

带有名字的函数表达式

你也可以给函数表达式中的函数起个名字,采用类似函数声明的语法。但这并不能使它变成一个函数声明,并且这个函数名不会被添加到作用域,函数体也不会被提前至顶端,下面用一些代码来演示我说的意思:

 1 foo(); //TypeError "undefined is not a function"
 2 bar(); //valid
 3 baz(); //TypeError "undefined is not a function"
 4 spam();//ReferenceError "spam is not defined"
 5 
 6 var foo=function(){}; //anonymous function expression('foo' get hoisted)
 7 function bar(){};     //function declaration ('bar' and the function body get hoisted)
 8 var baz=function spam(){};//named function expression('only 'baz' get hoisted)
 9 
10 foo(); //valid
11 bar(); //valid
12 baz(); //valid
13 spam();//ReferenceError "spam is not defined"

怎么利用这些知识编程

现在你已经理解作用域和声明提前特性了,那么这些在JavaScript编程中有什么影响?最重要的是声明变量时要使用"var"关键字,我强烈建议你在每个作用域的顶端只写一个var语句(多变量的时候,用逗号连接)。如果你强制自己这样做,就不会对声明提升产生困惑了。不过,这么做会让你在当前作用域中寻找已经声明的变量变得更困难,我建议使用"JSLint"的"onevar"选项来验证代码,如果你照做了,你的代码看起来会像这样子:

1 /*jslint onevar: true [...]*/
2 function foo(a,b,c){
3     var x=1,
4         bar,
5         baz="something";
6 }

看看规范怎么说

我发现经常查阅ECMAScript规范文档有助于直接理解这些机制是怎么运行的,以下是规范对于变量声明和作用域的描述:

1 如果变量声明语句在函数声明里面,那么变量就是定义在函数内部作用域(参考章节10.1.3),否则它们就是定义在全局作用域内(作为全局对象的成员变量,参考章节10.1.3)。变量进入作用域的时候就会被创建,块语句不会定义一个新的执行作用域,只有程序和函数声明会产生新的作用域。变量在创建的时候会被初始化为"undefined",一个带有初始化语句的变量,在赋值语句执行的时候才会被赋上其赋值表达式对应的值,并不是变量创建的时候就赋值。

我希望这篇文章能够帮助JavaScript开发者理清一些困惑的问题,我已经尽可能的彻底把问题讲清楚,以免造成更多的疑惑。如果你发现我写错了或者遗漏了某些重要的东西,请一定让我知道。

===翻译完===

翻译参考:http://ju.outofmemory.cn/entry/85659

以下是一个例子:

 1 var x=0;
 2 var f=function(){
 3     x=1;
 4 }
 5 f();
 6 console.log(x);
 7 function f(){
 8     x=2;
 9 }
10 f();
11 console.log(x);

 

posted @ 2014-12-31 18:22  Yanyd  阅读(852)  评论(0编辑  收藏  举报