不懂Ruby的程序员,如何快速读懂Ruby代码
本问答的目标读者是不了解Ruby语言、但有别的编程语言经验的人。
Ruby语言的代码可读性是很强的。本问答只把一些语法特点、以及别的语言中可能没有或不同的东西展现出来,目的在于让有别的编程语言经验的人能快速读懂Ruby代码。
注意本问答讲的是Ruby语言本身(基于版本1.9),而不是Ruby on Rails,后者是Ruby的一种DSL,语言面貌上和Ruby有一定差异。
Ruby语言的代码可读性是很强的。本问答只把一些语法特点、以及别的语言中可能没有或不同的东西展现出来,目的在于让有别的编程语言经验的人能快速读懂Ruby代码。
注意本问答讲的是Ruby语言本身(基于版本1.9),而不是Ruby on Rails,后者是Ruby的一种DSL,语言面貌上和Ruby有一定差异。
Q:Ruby最有特点的语法形式是什么?
或许是方法后接代码块的大量使用,以下面这行代码为例:
file.each_line("x") { |line| print line }
表示在file对象上调用each_line方法(以"x"为行的分隔符),该方法的功能是依次得到每一行,传递给后面的代码块,代码块把传来的行赋值给 line变量,然后在代码块里对line进行处理,处理完毕则从代码块返回each_line方法,再由它得到下一行,再一次传递给代码块。——像 each_line这样的方法,Ruby中称之为迭代器方法(iterator)。
又比如这个例子:
open('test.txt') { |f| line_array = f.readlines }
用open方法打开test.txt文件,生成了一个File类的实例对象,并把这个对象传递给后面的代码块,赋值给变量f,然后代码块里对f进行操作,操作完毕后返回open方法,open方法再把f关闭,所以这一行代码相当于如下三行:
f = open('test.txt')
line_array = f.readlines
f.close
Ruby风格写法的好处:一行完成,逻辑紧凑;自动关闭文件,防止忘了f.close;
当前scope少创建一个变量名f,代码块关闭后,f就消失了
一个Ruby风格的完整命令就是由对象、方法(包含参数)、代码块(包含参数)构成的。有的方法可以不接代码块。
Q:我看到有些代码和上面提到的写法不太像,是怎么回事?
有些DSL看起来和Ruby语言本身不大像,但其实语法格局是一样的,只是通过一些设定伪装成别的风格。
大致有四点导致这种情况:
1、隐性地调用方法,让方法看起来像函数或关键词;
Ruby中没有函数,全都是方法。方法就得在某个对象上调用,但是这个对象可以隐藏
方法不在某个对象上显式调用,那它就一定是在self所指的对象上调用
如open(file)实际是self.open(file),不过open是私有方法,不能显式写出对象
2、省略了括起参数的括号;
如open('test.txt','w')可以写成open 'test.txt', 'w'
3、代码块的{...}改成do...end;
open 'test.txt' do |line|
end
就相当于open('test.txt') {|line| }
这是很常见的,{...}和do...end只在优先级上有一些不同,一般都可互换
通常的风格是:代码块里的代码若只有一行,则用{},若有多行,则用do...end
这只是风格管理,实际上即使是多行代码,你也可以用{}括起来
4、省略作为方法参数的哈希(散列)字面量的花括号。
很多方法喜欢拿一个哈希做参数,如果哈希是方法调用的最后一个参数,则花括号可省略
task :name => :test 相当于 task({:name => :test})
如下一段代码:
HTMLForm.generate(STDOUT) do
comment "This is a simple HTML form"
form :name => "registration",
:action => "http://www.example.com/register.cgi" do
content "Name:"
input :name => "name"
content "Address:"
textarea :name => "address", :rows=>6, :cols=>40 do
"Please enter your mailing address here"
end
end
end
如果写“全”来,就相当于这样:
HTMLForm.generate(STDOUT) {
self.comment("This is a simple HTML form")
self.form({:name => "registration",
:action => "http://www.example.com/register.cgi"}) {
self.content("Name:")
self.input({:name => "name"})
self.content("Address:")
self.textarea({:name => "address", :rows=>6, :cols=>40}) {
"Please enter your mailing address here"
}
}
}
Q:我听说Ruby分1.8和1.9两个版本,二者的语法有什么不同?
目前Ruby流行1.8.x和1.9.x两个主要版本。1.9.x版使用新的解释器YARV,比1.8.x速度快;重写了String类,增加了Encoding类,从此可以完善处理多字节字符;杀手应用RoR也一早支持了1.9.x版;还有一些语法上的改进。
本问答以1.9版语法为准,两个版本有一些语法差别,略提几条区别的线索:
§ 如果有require 'rubygems'的,为1.8版;
§ 如果看见$KCODE的,为1.8版;
§ 哈希的键值对之间可以用逗号(而非=>)分隔的,为1.8版;
§ if condition:这种和Python一样的写法(条件之后用冒号),为1.8版
§ {|a,b;x,y| }的写法(用分号隔开两类参数),一定是1.9版
Q:有些写法感觉很奇怪,比如5.times { puts "Ruby! " },怎么理解?
这种写法其实很酷。Ruby中一切值都是对象,包括整数。Integer类有实例方法times,依次传递0到n-1给后面的代码块,相当于运行n次后接的代码块。
这一代码就是在5上调用方法times
Q:Ruby代码中很少看见for...in/foreach的写法,为什么?
相比for i in xx的循环方式,Ruby的风格是更喜欢用xx.each {|i| }这种调用迭代器方法的方式。
对于数组for elem in array,迭代器方法写作array.each { |elem| }
对于读文件的每行for line in file,迭代器方法写作file.each { |line| }
相比for...in方式,迭代器方法更快,更灵活,更强大,比如对于一个file对象
file.each_line { |line| } # 每次处理一行
file.each(' ') { |para| } # 每次处理一段
file.each_char { |char| } # 每次处理一个字符
file.each_byte { |byte| } # 每次处理一个字节
file.each_line.with_index(1) { |line, lineno| }
# 传递行时,还把索引值(在这里就是行号)也传递给代码块
这些都不是for...in擅长的
至于for(i=0; i<10; i++)这种写法,Ruby当然是写成9.times {|i| }这种形式了
Q:Benchmark::measure、Benchmark.measure两种写法有什么区别?
表示方法调用,用::还是用.,完全是一样的,指向的是同一个方法,区别只在于作者怎么看待measure这个方法。
符号::一般是用来分隔嵌套的模块、类、常量的,写成Benchmark::measure,像是表明measure是在Benchmark这个模块中定义的函数,Benchmark只是它的容器;而写成Benchmark.measure,像是在说measure是对Benchmark这个对象进行操作。
从内部实现上说,Ruby中只有方法,没有函数;但从内涵上说,Benchmark::measure的意义更确切,所以有人愿意这样写。
Q:Array#each是什么意思?
Array#each的写法并不用在实际代码中,而是文档中约定俗成的一种写法,表示Array类中定义的实例方法:
array = Array.new
array.each {} # Array#each指的就是这里的each,是Array类的实例所用
Q:::Foobar是什么意思?
其中的::是分隔嵌套模块、类、一般常量的分隔符,::前面没有东西,表示到global scope去找这个常量。
Q:经常听到Ruby“一切皆对象”的说法,怎么理解?
严格来说,应该是Ruby中一切可独立的合法语言片段都是表达式,表达式都要返回一个值,而一切值在Ruby中都是对象。
比如true false nil也是对象,分别是TrueClass、FalseClass、NilClass的实例
比如if结构可独立,所以是表达式,所以要返回值,这个值总是一个对象,所以if结构可以赋值给一个变量:
a = if x > y
x + 4
else
y * 2
end
比如模块、类也是对象,String、Array等类是Class类的实例对象,Class作为对象也是Class这个类的实例
Q:$foo、@bar和@@baz里的$、@、@@是什么意思?
Ruby没有global、local之类关键词设定变量可见范围,而是采用变量自带标记的方式
§ 以小写字母或_开头的变量是局部变量
§以$开头的是全局变量
§以@开头的是每个对象自身的实例变量
§以@@开头的是同类对象都可访问的类变量
class A
def initialize(var)
@s=var
@@ss=var
end
def to_s
"s=#@s,ss=#@@ss"
end
end
a=A.new("1")
puts a.to_s
b=A.new("2")
puts b.to_s
puts a.to_s
$ ruby a.rb
s=1,ss=1
s=2,ss=2
s=1,ss=2
@@变量在一个实例里变了,所有实例都会变
Q:大写字母开头的名称代表什么?
大写字母开头的是常量,包括模块名、类名都以大写字母开头,如Array、Enumerable都是常量。常量的意思是这个名称和某个对象的联系是固定了的,但不表示那个对象不可更改,如:
Foobar = [ 1, 2, 3 ]
Foobar[2] = 99
print Foobar # [1, 2, 99]
要想常量所指的对象不可修改,那应该 Foobar = [ 1, 2, 3 ].freeze
Q:STDIN、STDOUT、STDERR和$stdin、$stdout、$stderr有什么区别?
STDIN这一类以大写字母开头,是常量;$stdin这一类以$开头,是全局变量。
常量不可变,STDOUT总指向屏幕显示(除非运行ruby时在命令行设置>out 2>err之类),变量可变,所以$stdin可以替换成别的IO/File对象。
全局的输出方法,如print puts等,总是向$stdout输出,而非向STDOUT输出,如:
print 1 # 这时$stdout和STDOUT是一致的,输出到屏幕
$stdout = open('output_file','w')
print 2 # 这时输出到output_file了
$stdout = STDOUT
print 3 # 又输出到屏幕了
Q:ARGV = ["a","b","c"]的写法为什么会报错?
Perl里写@ARGV = qw(a b c)和Python里写sys.argv = ["a","b","c"]都是OK的
Ruby这么写报错的原因其实也很简单,因为ARGV以大写字母开头,所以它是个常量,ruby解析器一启动,ARGV常量就设置好了,再用等号赋值的方式,表示你想改变这个常量跟某个对象之间的联系,对常量来说这是不行的
所以在Ruby里得写成ARGV.replace ["a","b","c"],replace是Array类的一个实例方法,表示不改变对象,只替换内容
Q:表示"什么都没有",用什么?null undef nil?
用nil。Perl里用undef表示什么也没有,但在Ruby里,undef是取消方法定义的关键词。
Q:在条件判断中,哪些算是真值,哪些算是假值?
在Ruby里false、nil表示假,其他所有对象都为真,包括0、""、[]等
Q:有些方法名称里有?和!,是什么意思?比如nil?和strip!
方法名的最后可以有一个?或!,这只是一种命名习惯,让方法的涵义看起来更好懂
加?的方法,通常都是返回true/false的
像nil?的功能是检测它的对象是否是nil,obj.nil?感觉就是在问obj是nil吗?
又如File.exist?("test.txt")感觉就是在问"test.txt"存在吗?
加!的方法,总有一个对应的不加!的方法,通常不加!的生成新对象,而加!的是对本对象进行修改,如String类的strip和strip!:
str = " abc "
new_str = str.strip # 不改动原str对象,而是新生成一个字符串,删去了前后空白符
str.strip! # 直接在原str对象上改动,删去str的前后空白符
?和!的使用并没有强制性的规定,你要定义一个返回true/false的方法,不加?也可以,或者某个以?结尾的方法,不返回true/false也可,!也是。总之?和!就是一般字符,不具有限定功能,只是增强可读性的
Q:我看到有def []=(name, value)这样的写法,什么意思?难道定义了"[]="这个方法?
Bingo![]=确实是一个方法。
Ruby语言中很多(但不是全部)操作符实际上都是方法,比如像+ - * / % << == ** 等都是。既然是方法,就可以在自己的类里定义。
str[2..4] = "xyz"其实相当于str.[]=(2..4,"xyz"),也就是在str对象上调用[]=方法,传递两个参数2..4和"xyz"
Q:我看到[1,2,3,4].from(2)的写法,但是在官方API里没有看到from这个方法啊?
说明from这个方法是第三方模块加到Array类里去的。
Ruby的类是开放的,即使是核心的类,你也可以随意添加方法、undef方法、增加别名等等
比如对于核心的String类:
class String
def to_file
File.open(self)
end
end
然后我就可以"filename.txt".to_file得到一个file对象了
Q:String#length方法和String#size方法有没有区别?
没有区别,这两个方法完全一样,是同义词。
Ruby的标准API里有不少方法的用法是完全相同的,作者的考虑可能是让不同来源的程序员都有亲近感,或者在不同的上下文使用,更接近自然语言;我是觉得这种冗余不太必要,但对常见的同义词方法,还是应知道一点。
如 String类的length和size同义,each_line和lines同义,each_char和chars同义,each_byte和 bytes同义;File类的each和each_line以及lines同义;Hash类的each和each_pair同义
Q:File#gets方法和File#readline方法有没有区别?
有区别,这两个方法都是读取文件下一行,但到文件末尾eof时,再gets会返回nil,而再readline会触发EOFError异常。
Ruby标准API里也有一些这种大体相同,但有细微差别的方法。
哪些方法是同义词,完全一样,哪些是近义,类似但有区别,确实给学习造成了一定的困难,只能是多查。
Q::encoding :xyz是什么意思?
这是Symbol类实例的字面量表示法,用个冒号放在字符之前,初学Ruby者可能容易把这个误认为是变量名。也可以写作:"encoding"这样,看起来就像个特殊的字符串,而不是变量名了,但通常是省略引号的。
Q:Symbol类实例有什么用途?
Ruby中的字符串是可变的,Symbol对象是不可变的,可以把Symbol对象理解为一种名称,一种标签。因为Symbol对象不可变,它用在哈希里当键比用字符串更有效率:
person = { :name => 'Joey', :age => 21, :rank => 5 } # 就比
person = { 'name' => 'Joey', 'age' => 21, 'rank' => 5 } # 更加ruby
另外,在一些方法中,经常用symbol做参数,指代方法等的名称,如:
str = "abc|def|ghi"
array = str.send(:split, "|") # 向str发送消息,相当于str.split("|")
Q:哈希字面量的写法是怎样的?
用花括号,键和值用=>分隔开,如:
hash = { :key1 => "val1", :key2 => "val2", :key3 => "val3" }
Perl众注意,这个=>是从Perl来的,但Perl里=>跟逗号完全一样,但在Ruby里,=>跟逗号是不同的
Q:哈希的键是有序的?
1.9版本的哈希,键确实是有序的,你{:a => 1, :b => 2, :c => 3}用each迭代时,总是首先出:a,其次出:b,然后出:c
但没看到官方保证后续版本一定也是这样,所以这就像杂牌充电器,你照样用来充电也没问题,但官方不给保修
Q:不带花括号的写法,比如:encoding => 'gbk'是什么意思?
还是一个hash,只是省略了花括号,这种写法常用在充当方法调用的最后一个参数时:
file = File.open('test.txt', :encoding = > 'gbk') # 相当于
file = File.open('test.txt', {:encoding = > 'gbk'}) # 第二个参数是个哈希
open方法内部接了这个哈希,opt = {:encoding = > 'gbk'},就可通过opt[:encoding]获得文件编码值,进行下一步处理
一些DSL很喜欢用这种方式来传递参数,比如:
class HTMLForm < XMLGrammar
element :form, :action => REQ,
:method => "GET",
:enctype => "application/x-www-form-urlencoded",
:name => OPT
element :input, :type => "text", :name => OPT, :value => OPT,
:maxlength => OPT, :size => OPT, :src => OPT,
:checked => BOOL, :disabled => BOOL, :readonly => BOOL
element :textarea, :rows => REQ, :cols => REQ, :name => OPT,
:disabled => BOOL, :readonly => BOOL
element :button, :name => OPT, :value => OPT,
:type => "submit", :disabled => OPT
end
看起来一个element带了好多参数,实际上呢,给它的只是两个参数
element :button, :name => OPT, :value => OPT,
:type => "submit", :disabled => OPT
相当于:
element(:button,{:name=>OPT, :value=>OPT, :type=>"submit", :disabled=>OPT})
参数就是一个:button(symbol),一个hash
Q:{a:1,b:2,c:3}也是哈希字面量么?是不是和Python的涵义一样?
不一样。Python要这样写,a、b、c是三个变量,而在Ruby中(只限1.9版),这其实是
{ :a => 1, :b => 2, :c => 3 }的另一种写法,a、b、c是三个symbol
为什么要引进这种写法呢?也是为了哈希做方法参数时好看
File.open('test.txt', :encoding = > 'gbk') # 就可以写成
File.open('test.txt', encoding: 'gbk')
上面的例子,写成这样也可以:
element :button, name: OPT, value: OPT, type: "submit", disabled: OPT
Q:1..5、"a"..."z"是什么意思?
是一个range对象的字面量表示法。1..5表示从1到5的范围,包含5(2个点包含尾端);
"a"..."z"表示从"a"到"z"的范围,不含"z"(3个点不含尾端)
这种写法是从Perl继承的,但是在Perl里1..5是一个列表,要写成1..得内存爆炸了,但在Ruby里,一个range对象只记录首端的1和尾端的,这么写没问题
range对象可以迭代操作:(1..6).each {|i| print i}
又如str[1..5]就是以一个range对象1..5做参数,表示第2个到第6个字符
Q:=>还有什么用途?
除了在hash里分隔键和值外,还用在异常处理语法里:
begin # 异常处理语法
# blah blah
rescue ArgumentError => e # 若上面代码触发ArgumentError,则赋值给e
# blah blah
end
还可以写成:rescue => e # 任何出现的异常都赋值给e
Q:这一句什么意思?m = a / b rescue 0
这是一种快捷的异常处理语法,A rescue B,若表达式A触发异常,则对B表达式求值并返回
m = a / b rescue 0 # 假如b是0,出现除0错误,那么右边的0作为返回值
$stdout = open(output_file,'w') rescue STDOUT
# 若output_file没有写权限,出错,则返回STDOUT给$stdout
Q:puts、p、print有什么区别?似乎Ruby众不喜欢用print?
puts打印一个字符串,如果字符串末尾没有"\n"则添加换行,如果有则不添加
puts "abc" # 实际打印的是"abc\n"
puts "abc\n" # 实际打印的还是"abc\n",而非"abc\n\n"
Ruby中用puts的情况应该比print多吧
p 则是打印供程序员调试的字符串,会把不在ASCII范围的字符转义
print "上下" # 打印出来:上下
p "上下" # 打印出来:"\上\下" 引号也是打印出来的内容
实际上 p obj相当于print obj.inspect,而obj.inspect相当于Python里的repr(obj)
Q:字符串里的#{}是什么意思?比如"a + b = #{ a + b }"
双引号内的表达式内插,如
a = b = 3
puts "a + b = #{ a + b }" # "a + b = 6"
Q:"%s = %f" % ["pi", Math::PI]是什么意思?
String类的%方法,调用在一个格式字符串之上,相当于printf出来新的字符串
Q:string << "a"、string << 65,array << "a",file << "a"中的<<各代表什么意思?
str << "a"表示将字符"a"加到str字符串尾端
str << 65表示将码点65所代表的字符(这里也是"a")加到str字符串尾端
Ruby中的字符串是可变的,用str << "a"的方式,是在str这个对象上直接修改,比str = str + "a"快,逻辑也清晰
array << "a"表示将"a"追加到array末尾,作为最后一个元素
file << ""表示打印到file对象,相当于file.print "a"
对于整数来说,<<则是位移方法。对象不同,<<的涵义也不同,很好的duck typing例证
Q:<<EOF是什么意思?
这叫做Here Document,Perl众懂的。
<<后面紧跟一个标记,从下一行开始到出现标记的行为止,其中字符串都存入这个Here Document,例如:
str1 = <<HD1.upcase + <<HD2.downcase
aaaaaaa
bbbbbbb
HD1
XXXXXXX
YYYYYYY
HD2
p str1 # "AAAAAAA\nBBBBBBB\nxxxxxxx\nyyyyyyy\n"
这种代码相当于下面:
str2 = "aaaaaaa
bbbbbbb
".upcase + "XXXXXXX
YYYYYYY
".downcase
又如:
eval_r(<<cmds)
a = b = 3
print a + b
cmds # 上面黄色的字不是代码,而是字符串
Q:`ls`是什么意思?
在操作系统中运行``里的命令,如在Windows下运行dir命令,返回dir出现的信息
`dir`.each_line.select { |line| line.start_with? '2011/09/08' }
# dir返回的信息,挑选每一行以"2011/09/08"开头的
Q:/[Rr]uby/是什么意思?
正则表达式的字面量表示法,和Perl的正则表达式简写形式一样。
Q:%w %q %Q %r是什么意思?
从Perl继承并加以变化的语法糖。
%w后接分界符(可以是%w{} %w() %w[] %w//等等),里面的字符串以空白符分开,这些字符串各自作为数组的元素
%w( abc 123 def 456) # 相当于 [ 'abc', '123', 'def', '456']
%q相当于单引号,只是中间出现\'不转义,主要用在字符串内有很多'和"时
%q{abc'def'} # 相当于 'abc\'def\''
%Q相当于双引号,主要也是用在字符串里有很多'和",只是里面可以内插表达式
bar = "foo"
%Q/foo"#{bar}"/ # => "foo\"foo\""
单独的%//也代表双引号,是%Q//的简写
%r相当于//,用于创建正则表达式
Q:$` $& $' $1 $2是什么意思?
当一个字符串和正则表达式匹配时,字符串中匹配正则表达式的那部分存入$&,之前的部分存入$`,之后的部分存入$'
如果正则表达式里有捕获括号,则第一个捕获的子串存入$1,第二个存入$2,依次类推
这种标点符号式的变量是直接从Perl中继承过来的,确实很丑陋,很影响代码可读性,现在Ruby对这些符号变量的使用是depreciated的
要想涵义清楚点,要么可以导入English.rb模块
require 'English'
$MATCH # 相当于 $&
$PREMATCH # 相当于 $`
$POSTMATCH # 相当于 $'
或者动用Regexp.last_match
Regexp.last_match.to_s # 相当于 $&
Regexp.last_match.pre_match # 相当于 $`
Regexp.last_match.post_match # 相当于 $'
类似的变量还有一些如$/ $* $.等,具体涵义可查相应的文档,自己写最好是不要用了
Q:=~是什么意思?
从Perl继承的,拿一个字符串和一个正则表达式进行匹配,返回第一次匹配的位置
和Perl不同的是,在Ruby中string =~ regexp和regexp =~ string两种写法都可以
Q:<=>是什么意思?
a <=> b返回-1 / 0 / 1或nil,左小右大则返回-1,左大右小则返回1,左右相等则返回0
比较没意义(不是同类对象比较)则返回nil,如123 <=> "abc"
Q:===是什么意思?
很多类定义了自己的===方法,涵义各不相同,例如:
§ Range类的===是测试参数是某个range的成员,如(1..10) === 5返回真
§ String类的===和==意义相同,都是测试两个字符串的值是否相等
§ Regexp类的===和=~意义相同,测试是否匹配
§ Class类的===是测试参数是否是类的成员
String、Array、Integer这些类本身也是对象,是Class类的实例,所以下面都返回真
String === "abc"
Array === [1,2,3]
Integer === 123
有的语言成分依赖===,但没有显式地使用===,最主要的是case...when结构(见下一问)
另外Arra#grep方法也依赖===
a = [1, "abc", :sss, 4.6, "def", :bar ]
p a.grep(String) # ["abc", "def"]
Array#grep方法,是对数组的每个元素elem,用方法参数arg === elem为真的则保留
这里就表示挑出String === elem为真的elem,也就是类为String的对象
Q:case...when结构的用法是什么?
最常见的case...when结构的用法如下:
generation = case birthyear
when 1946..1963 then "Baby Boomer"
when 1964..1976 then "Generation X"
when 1978..2000 then "Generation Y"
else nil
end
case后面的表达式只求值一次,得到的值依次去被when后的对象用===比较,哪一次为真,则返回相应的值,此例中就是以1946..196、1964..1976、1978..2000三个range对象去===birthyear
Q:赋值操作、方法定义和方法调用里的*是什么意思?
§ 赋值操作比如:
x, *y = 1, 2, 3 # x == 1; y == [2,3]
*x, y = 1, 2, 3 # x == [1,2]; y == 3
x, *y, z = 1, 2 # x == 1; y == []; z == 2
*这标记的作用好像是在说“你们先拿,剩下全归我”
在平行赋值中,左边只可以有一个*,但是位置可以任意(1.8版本只能在最后)
别的变量得到各自的值以后,剩下的全归*,变成一个数组(数组有可能为空)
在方法定义中的情况一样,对于多参数而言,也是“你们先拿,剩下全归我”
def foo(a,b,*x)
# 表示调用foo时,至少要两个参数,赋值给a和b,剩下全给x,x是一个数组
def bar(*args) # 表示可以有任意数量的参数
方法调用中*的作用和定义相反,是放在一个数组之前,把其元素拆成参数
args = [1,2,3]
bar(args) # 传递给bar的是一个参数,数组[1,2,3]
bar(*args) # 传递给bar的是3个参数,1,2,3
Q:代码块是对象吗?
不是。代码块不能独立存在,单独写{|n| n * 2 },是会报错的。
但是代码块可以对象化,对象化后的代码块是Proc类的实例。
将代码块对象化的写法主要有两种:
proc1 = Proc.new {|n| n * 2 }
proc2 = lambda {|n| n *2 }
两种写法生成的proc对象有细微差别,break和return等的行为有异。
Q:为什么这样写不行:foo = lambda {|n| n * 2 }; foo(5)
Python类似的写法foo = lambda n: n * 2可行,但在Ruby中,foo得到的是一个对象,而非函数,不能在对象上加参数,当成方法用。
所以得写成foo.call(5),表示在foo对象上调用call方法,传递参数5
Q:代码块{ |a; x| }里设置参数的部分,分号后面的变量是什么意思?
(1.8版本不可用)分号前面的a,用来接受方法传递过来的参数,自然是block-local的
分号后面的x,则是设置别的block-local变量,在代码块中修改x,不会影响代码块外可能存在的x,如:
x = a = 9
3.times do |a; x|
x = a * 2
print [ a, x ] # 依次打印[0, 0][1, 2][2, 4]
end
print [ a, x ] # 仍然是[9, 9]
x = a = 9
3.times do |a|
x = a * 2
print [ a, x ]
end
print [ a, x ] # 变成[9, 4]了
Q:->是什么意思?比如 ->(x,y=10) { print x*y }
是1.9版本新加的lambda语法,把原本在代码块中的参数移到前面去了
->(x,y) { print x * y } # 相当于 lambda { |x,y| print x * y }
有一个好处是参数可以设置默认值,->(x,y=10) {}
有争议的地方是和别的语言中的->的涵义完全不同
Q:不接代码块的each方法是什么意思?比如e = [ 1, 2, 3, 4, 5 ].each
很多方法会根据是否后接block而运行不同的功能,返回不同的值。
比如这个each方法,如果后接代码块,则会把数组中的每个元素依次传递给代码块,让它运行某些命令,而如果each方法未后接代码块,则返回一个Enumerator实例
很多一般后接代码块的迭代方法若不加block,都返回Enumerator实例,如File类和String类的each_line、each_char等(这个不是语法规定,而是方法内部就这么处理的,具体参见官方API文档)
Q:Enumerator类的作用是什么?
可以说把迭代操作这个动作抽象化为对象。一般的用途包括:
1、多个对象同时并行迭代,如:
e1 = [ 1, 2, 3, 4, 5].each
e2 = [ 99, 98, 97, 96 ,95].each
new_array = []
loop {
new_array << e1.next
new_array << e2.next
}
p new_array # [1, 99, 2, 98, 3, 97, 4, 96, 5, 95]
2、给原来的迭代方法增加新的功能,如Enumerator类有一个方法with_index:
e1 = string.each_char
e2 = array.each
e1.with_index(1) {|char,index| } # 参数1表示从1开始计数,无参数则从0开始
e2.with_index {|elem,index| }
这样传递给后面block的,就不仅包括原来的每个字符、每个元素,连带把对应的索引数也传了
3、无限循环。可以定义一个带yield的方法,转换为Enumerator对象,实现无限循环
def foo
i = 0; loop { i = i + 3; yield i }
end
#foo {|i| print i} # 别运行,这是死循环
e = to_enum(:foo)
# to_enum的作用是把:foo这个symbol所指代的foo方法转为Enumerator对象
1234.times { e.next } # 让它迭代1234次,可以无限迭代
p e.next # 3705
Q:yield是干什么用的?
方法定义中把控制权交给代码块,是用来实现each这一类迭代方法的直接途径:
def from_to_by(from, to, by)
x = from
while x <= to
yield x
x += by
end
end
from_to_by(3,26,4) {|x| print x, " " } # 3 7 11 15 19 23
自己的迭代方法就这样定义好了
Q:iterator?是什么意思?
现在一般写成block_given?,这就好理解一点了吧。
在方法定义中用来判断这个方法在调用时是否后接代码块
def foo
if block_given?
# blah blah
else
# blah blah
end
end
这样一个方法就可以根据是否后接block而做不同的事了
iterator? 是block_given?的同义词,字面意思是问当前方法是否用作iterator,用作iterator意味着必接block,像each这样的方法可以说是iterator方法,但不是所有后接代码块的都是iterator,如File.open(file) {|f| },这个时候说open是iterator就不太妥当,而说block_given?总是恰当的
Q:方法定义和方法调用里的&是什么意思?比如def foo(a,b,&blk)
在方法定义中,&连带后面的变量名必须是最后一个,表示把方法调用时的代码块转换为Proc实例
def foo(a,b,&blk)
# blah blah
end
foo(x,y) {|n| n + 1}
# blk的值就相当于Proc.new {|n| n + 1}了
如果没带代码块,不会报错,只是blk的值为nil了
用这种方式最大的好处是:blk是一个对象,可以传递给别的方法
而 blk.call(x,y) 相当于 yield x,y,blk.nil? 也可以达到和 block_given? 同样的目的,检测是否接了代码块
Q:array.map(&:upcase)是什么意思?
这种写法有点晦涩。上面已经说了&的涵义,&要求它后面的对象是个Proc实例,假如不是,则调用它的to_proc方法生成一个proc
而Symbol类正好有一个实例方法to_proc
:a_method.to_proc 变成的代码块相当于:
Proc.new {|obj, *args| obj.send(:a_method,*args) }
array.map(&:upcase)的理解过程是:
一变:array.map {|obj, *args| obj.send(:upcase, *args) }
二变:array.map {|obj, *args| obj.upcase(*args)
三变:array.map {|obj| obj.upcase } # upcase这个方法不需参数
Q:class Foo < Bar是什么意思?
表示创建新的类Foo,是Bar的子类,Ruby用<形象地表示Foo和Bar之间的关系
<也可以用来快速检测两个类或模块之间的关系,如String类是Object类的子类,则
String < Object # true
Object > String # true
Q:class << obj是什么意思?
打开obj的singleton类,通常用来定义singleton方法
比如str是个字符串,也就是个String类的实例,String类的实例方法str都可以调用
我们又可以定义只有str这个对象才能调用的方法,这样的方法就是str的singleton方法
class << str
def foo # 这个foo方法只能被str调用,不能被String类的其他实例调用
# blah blah
end
end
Q:def obj.method是什么意思?
也是定义obj的singleton方法,直接定义,没有打开singleton class
定义所谓类方法,也是这种方式:
def String.foo
# blah blah
end
实际上类也是对象,所谓类方法,也就是类对象的singleton方法
Q:定义方法为什么不用self作为第一个参数?
Ruby是纯OOP语言,没有函数,全是方法,所以省了传递self
class String
def foo(x,y,z)
# blah blah
end
end
str = "abc"
str.foo(1,2,3)
# 方法定义时的参数,和方法调用时的参数,看起来就一致了
Q:Ruby中的self是变量么?
不是变量,而是个关键词。在任何环境self都指向一个对象
module Foo
p self # self 为 Foo
class Bar
p self # self 为 Foo::Bar
def baz
p self # self 为调用此方法的对象
end
end
end
Q:sub、gsub方法是什么作用?
String类的sub方法作用是替换子串并生成新字符串,gsub是替换所有匹配子串
对应的sub!和gsub!是在原字符串上进行修改,不生成新对象
String#replace并不是替换子串的作用,而是把字符串整个替换成别的值,但本身对象不变
str = "abc"
str.replace "def"
# str有相同的object_id,但内容由"abc"替换为"def"了
Q:String类的scan方法是什么作用?
从一个字符串中抽取出所有匹配的子串
str = "a1b2c3d4e5"
p str.scan(/\d/) # ["1", "2", "3", "4", "5"]
可以后接代码块依次处理每个匹配子串
str.scan(/\d/) {|c| print c}
Q:Array类的&和|表示什么意思?
&表示返回两个数组的交集,去除重复元素
[ 1, 1, 3, 5 ] & [ 1, 2, 3 ] #=> [ 1, 3 ]
|表示返回两个数组的并集,去除重复元素
[ "a", "b", "c" ] | [ "c", "d", "a" ] #=> [ "a", "b", "c", "d" ]