JavaScript高级程序设计学习笔记--变量、作用域和内存问题(一) (变量、作用域)
JavaScript的变量与其他语言的变量有很大区别。JavaScript变量松散类型的本质,决定了它只是在特定时间用于保存特定值的一个名 字而已。由于不存在定义某个变量必须要保存何种数据类型值的规则,变量的值及其数据类型可以在脚本的生命周期内改变。尽管从某种角度看,这可能是一个既有 趣又强大,同时又容易出问题的特性,但JavaScript变量实际的复杂程度还远不止如此。
基本类型和引用类型的值
ECMAScript变量可能包含两种不同数据类型的值:基本类型值和引用类型值。基本类型值指的是那些保存在栈内存中的简单数据段,即这种值完全 保存在内存中的一个位置。而引用类型值是指那些保存堆内存中的对象,意思是变量中保存的实际上只是一个指针,这个指针指向内存中的另一个位置,该位置保存 对象。
在将一个值赋给变量时,解析器必须确定这个值是基本类型值,还是引用类型值。5种基本数据类型:Undefined、Null、Boolean、 Number和String。这5种基本数据类型的值在内存中分别占有固定大小的空间,因此可以把它们的值保存在栈内存。而且,这样也可以提高查询变量的 速度。对于保存基本类型值的变量,我们说它们是按值访问的,因为我们操作的是它们实际保存的值。
在某些语言中,字符串以对象的形式来表示,因此被认为是引用类型的。ECMAScript放弃了这一传统。
如果赋给变量的是一个引用类型的值,则必须在堆内存中为这个值分配空间。由于这种值的大小不固定,因此不能把它们保存到栈内存中。但内存地址的大小 是固定的,因此可以将内存地址保存在栈内存中。这样,当查询引用类型的变量时,就可以首先从栈中读取内存地址,然后再“顺藤摸瓜”地找到保存在堆中的值。 对于这种查询变量值的方式,我们把它叫做按引用访问,因为我们操作的不是实际的值,而是被那个值所引用的对象。
保存在栈内存中的每个值,分别占据着固定大小的空间,可以按照顺序来访问它们。如果栈内存中保存的是一块内存的地址,则这个值就像是一个指向对象在堆内存中位置的指针。保存在堆内存中的数据不是按顺序访问的,因为每个对象所需要的空间并不相等。
动态属性
定义基本类型值和引用类型值的方式是类似的:创建一个变量并为该变量赋值。但是,当这个值保存到变量中以后,对不同类型值可以执行的操作大相径庭。对于引用类型的值,我们可以为其添加属性和方法,也可以改变和删除其属性和方法。如:
var person = new Object(); person.name = "Nicholas"; alert(person.name); //"Nicholas"
以上代码创建了一个对象并将其保存在了变量person中。然后,我们为该对象添加了一个名为name的属性,并将字符串“Nicholas”赋给了这个属性。紧接着又alert()函数访问了这个新属性。如果对象不被销毁或这个属性不被删除,则这个属性将一直存在。
但是我们不能给基本类型的值添加属性,尽管这样不会导致任何错误。
复制变量值
除了保存方式不同职位,从一个变量向另一个变量复制基本类型值和引用类型值时,也存在不同。 如果从一个变量向另一个变量复制基本类型值,会在栈中创建一个新值,然后把该值复制到为新变量分配的位置上。
当从一个变量向另一个变量复制引用类型的值时,同样也会将储存在栈中的值复制一份放到为新变量分配的空间中。不同的是,这个值的副本实际上是一个指针,而这个指针指向存储在堆中的一个对象。复制操作结束后,两个变量实际上将引用同一个对象。因此,改变其中一个变量,就会影响到另一个变量。
传递参数
ECMAScript中所有的函数的参数都是按值传递的。也就是说,把函数外部的值复制给函数内部的参数,就和把值从一个变量复制到另一个变量一 样。基本类型的值的传递如同基本类型变量的复制一样,而引用类型值的传递,则如同引用类型变量的复制一样。有不少开发人员在这一点上可能会感到困惑,因为 访问变量有按值和按引用两种方式,而参数只能按值传递。
在向参数传递基本类型值时,被传递的值会被复制给一个局部变量(即命名参数,或者用ECMAScript的概念来说,就是arguments对象中的一个元素)。在向参数传递引用类型的值时,会把这个值在内存中的地址复制给一个局部变量,因此这个局部变量的变化会反映在函数的外部。
function setName(obj){ obj.name = "Nicholas"; } var person = new Object(); setName(person); alert(person.name); //"Nicholas"
以上代码中创建一个对象,并将其保存在了变量person中。然后,这个对象被传递到setName()函数中之后就被复制给了obj。在这个函数 内部,obj和person引用的是同一个对象。换句话说,即使这个对象是按值传递的,obj也会按引用访问同一个对象。于是,当中函数内部为obj添加 name属性后,函数外部的person也将有所反映; 因为person指向的对象在堆内存中只有一个,而且是全局对象。 很多开发人员错误的认为:在局部作用域中修改的对象会在全局作用域中反映出来,就说明参数是按引用传递的。为了证明参数是按值传递的,我们再看一看下面这 个经过修改的例子:
function setName(obj){ obj.name = "Nicholas"; obj = new Object(); obj.name = "Greg"; } var person = new Object(); setName(person); alert(person.name); //"Nicholas"
这个例子与前一个例子唯一的区别,就是setName()函数中添加了两行代码:一行代码为obj重新定义了一个对象,令一行代码为该对象定义了一 个带有不同值的name属性。在把person传递给setName()后,其name属性被设置为“Nicholas”。然后又将一个新对象赋值给变量 obj,同时将其name属性设置为"Greg"。如果person是按引用传递的,那么person就会自动被修改为指向其name属性为“Greg” 的新对象。 但是,当接下再访问person.name时,显示的值仍然是“Nicholas”。这说明即使在函数内部修改了参数的值,但原始的引用仍然保持未变。实 际上,当在函数内部重新写obj时,这个变量引用的就是一个局部对象了。而这个局部对象会在函数执行完毕后立即被销毁。
检测类型
要检测一个变量是是不是基本数据类型,typeof操作符是最佳的工具。说得更具体一点,typeof操作符是确定一个变量是字符串、数值、布尔 值,还是undefined的最佳工具。如果变量的值是一个对象或null,则typeof操作符会返回"object"。对一个值使用typeof操作 符可能返回下列某个字符串:
- "undefined" — 如果这个值未定义;
- "boolean" — 如果这个值是布尔值;
- "string" — 如果这个值是字符串;
- "number" — 如果这个值是数值;
- "object" — 如果这个值是对象或null;
- "function" — 如果这个值是函数。
虽然在检测基本数据类型时typeof是非常得力的,但在检测引用类型的值时,这个操作符的用处不大。通常我们并不是想知道某个值是对象,而是想知道它是什么类型的对象。为此,ECMAScript提供了instanceof操作符,语法如下:
result = variable instanceof constuctor
如果变量是给定引用类型(有构造函数表示)的实例,那么instanceof操作符就会返回true。请看下面的例子:
alert(person instanceof Object) ; //变量person是object吗? alert(colors instanceof Array); //变量colors是Array吗? alert(pattern instanceof RegExp) //变量pattern是RegExp吗?
根据规定,所有引用类型的值都是Object的实例。因此,在检测一个引用类型值和Object构造函数时,instanceof操作符都会返回 true。当然,如果使用instanceof操作符检测基本类型的值,则该操作符始终会返回false,因为基本类型不是对象。
在Safari和Chrome中使用typeof检测正则表达式时,会错误地返回“function”
执行环境及作用域
执行环境(execution context,为简单起见,有时也称为“环境”) 是JavaScript中最为重要的一个概念。执行环境定义了变量或函数有权访问的其他数据,决定了它们各自的行为。每个执行环境都有一个与之关联的变量 对象(variable object),环境中定义的所有变量和函数都保存在这个对象中,虽然我们编写的代码无法访问这个对象,但解析器在处理数据时会在后台使用它。
全局执行环境是最外围的一个执行环境。根据ECMAScript实现所在的宿主环境不同,表示执行环境的对象也不一样。在Web浏览器中,全局执行 环境被认为是window对象,因此所有全局变量和函数都是作为window对象的属性和方法创建的。某个执行环境中的所有代码执行完毕后,该环境被销 毁,保存在其中的所有变量和函数定义也随之销毁(全局执行环境直到应用程序退出--例如关闭网页或浏览器时才会被销毁)。
每个函数在被调用时都会创建自己的执行环境。当执行流进入一个函数时,函数的环境就会被推入一个环境栈中。而在函数执行之后,栈将其环境弹出,把控制权返回给之前的执行环境。ECMAScript程序中的执行流整数由这个方便的机制控制着。
当代码在一个环境中执行时,会创建由变量对象构成的一个作用域链(scope chain)。作用域链的用途,是保证对执行环境有权访问的所有变量和函数的有序访问。作用域链的前端,始终都是当前执行的代码所在环境的变量的对象。如 果这个环境是函数,则将其活动对象(activation object)作为变量对象。活动对象在最开始只包含一个变量,即arguments对象(这个对象在全局环境中是不存在的)。作用域链中的下一个变量对 象来自包含(外部)环境,而再下一个变量对象则来自下一个包含环境。这样,一直延续到全局执行环境,全局执行环境的变量对象都是作用域链中的最后一个对 象。
标识符解析是沿着作用域链一级一级地搜索标识符的过程。搜索过程始终从作用域链的前端开始,然后逐级地向后回溯,直到找到标识符位置(如果找不到标识符,通常会导致错误发生)。
请看下面的例子:
var color = "blue"; function changeColor() { if (color == 'blue') { color = "red"; } else { color = "blue"; } } changeColor(); alert("Color is now " + color);
在这个简单的例子中,函数changeColor()的作用域链包含两个对象:它自己的变量对象(其中定义着arguments对象)和全局环境的变量对象。 可以在函数内部访问变量color,就是因为可以在作用域链中找到它。
内部环境可以通过作用域链访问所有的外部环境,但外部环境不能访问内部环境的任何变量和函数。 这些环境之间的联系是线性的、有次序的。 每个环境都可以向上搜索作用域链,以查询变量和函数名; 但任何环境都不能通过向下搜索作用域而进入另一个执行环境。 局部环境开始时会先在自己的变量对象中搜索变量和函数名,如果搜索不到则再搜索上一级作用域链。
(函数参数也被当做变量来对待,因此其访问规则与执行环境中的其它变量相同)
1.延长作用域链
虽然执行环境的类型总共只有两种—— 全局和局部(函数),但是还有其他方法来延长作用域。 这么说是因为有些语句可以在作用域链的前端临时增加一个变量对象,该变量对象会在代码执行后被移除。 在两种情况下回发生这种现象。 具体来说,就是当执行流进入下列任何一个语句时,作用域链就会得到加长:
- try-catch语句的catch块;
- with语句。
这两个语句都会在作用域链的前端添加一个变量。对with语句来说,其变量对象中包含着为指定对象的所有属性和方法所作的变量声明。 对catch语句来说,其变量对象中包含的是被抛出的错误对象的声明。 这些变量对象都是只读的,因此在with和catch语句中声明的变量都会被添加到所在执行环境的变量对象中。
例1:
function buildUrl() { var qs = "?debug=true"; with(location){ var url = href + qs; } return url; } var result = buildUrl(); alert(result);
在此,with语句接收到的是location对象,因此其变量对象中就包含了location对象的所有属性和方法,而这个变量对象被添加到了作 用域链的前端。 buildUrl()函数中定义了一个变量qs。 当在with语句中引用href时(实际上引用的是location.href),可以在当前执行环境的变量对象中找到。 当引用变量qs时,引用的则是在buildUrl()中定义的那个变量,而该变量位于函数环境的变量对象中。 至于with语句内部,则定义了一个名为url的变量。 由于with语句的变量对象是只读的,结果url就成了函数执行环境的一部分(变量添加到了with外部环境即bulidUrl()中),因而可以作为函 数的值被返回。
例2:
var person = { name: "nico", age: 30 }; function test(){ var name = "nana"; with(person) { alert(name); friends = "john"; } alert(friends); } test(); var person = { name: "nico", age: 30 }; function test(){ var name = "nana"; with(person) { alert(name); //"nico" friends = "john"; } alert(friends); //"john" } test();
这是另一个简单的例子。
2.没有块级作用域
JavaScript没有块级作用域经常会导致理解上的困惑。 在其他类C语言中,由花括号封闭的代码块都有自己的作用域(如果用ECMAScirpt的话来讲,就是它们的执行环境),因此支持根据条件来定义变量。 例如:在下面的代码
if (true) { var color = "blue"; } alert(color); //blue
这里是在一个if语句中定义了变量。 如果在C、C++或Java中,color会在if语句执行完毕后被销毁。 但在javascript中,if语句中声明的变量会加入到当前执行环境。 在使用for语句中尤其要牢记这一点差异,例如:
for (var i=0; i < 10; i++) { //do something } alert(i); //10
2.1 声明变量
使用var关键字声明变量,这个变量将被添加到距离最近的可用环境中。 对于函数而言,这个最近的环境就是函数的局部环境; 对于前面例子中的with语句而言,这个最近的环境也是函数的环境。 如果变量在未加声明的情况下被初始化,那么该变量会被自动添加到全局环境。
例1:
function add(num1, num2) { var sum = num1 + num2; return sum; } var result = add(10, 20); alert(sum); //sum不是有效变量,出错 例2: function add(num1, num2) { sum = num1 + num2; return sum; } var result = add(10, 20); alert(sum); //30
在编写JavaScript代码的过程中, 不声明而直接初始化变量是一个常见的错误做法,因为这样可能会导致意外。 我们的建议是在初始化变量之前,一定要先声明; 这样就可以避免类似问题。
2.2 查询标识符
当在某个环境中为了读取或写入而引用一个标识符时,必须通过搜索来确定改标识符实际代表什么。 搜索过程从作用域链的前端开始,向上逐级查询与给定名字匹配的标识符。 如果在局部环境中找到了该标识符,搜索过程停止,变量就绪。 如果在局部环境中没有找到该变量,则继续沿作用域链向上搜索。 搜索过程将一直追溯到全局环境的变量对象。如果在全局环境中也没有找到这个标识符,则意味着该变量尚未声明。 搜索过程中,如果找到一个局部变量的定义,则搜索自动停止,不再进入另一个变量对象。 换句话说,如果局部环境中存在着同名标识符,就不会使用父环境中的标识符。
变量查询也不是没有代价的。 很明显,访问局部变量要比访问全局变量更快,因为不用向上搜索作用域链。