《正则指引》学习笔记

# encoding:UTF-8
#---------------------------------- 字符组 --------------------------------------------------------
=begin
#1、识别GBK编码时,需要使用Unicode编码环境,在源文件顶部指定 # encoding:UTF-8
#2、ruby 1.8,正则表达式中有非ASCII字符,则最好在表达式末尾写上u显示指定Unicode模式
=end
puts "罚" =~ /[收发]/u # nil
puts "发" =~ /[收发]/u # 0
=begin
#1、ruby 1.8,匹配位置按照字节计算,UTF-8编码每个汉字占3个字节
=end
puts "我发" =~ /[收发]/u # 3
=begin
#1、ruby 1.8,POSIX字符组只能匹配ASCII字符,而且不可使用[:ascii:]、[:word:]
=end
puts "0" =~ /[[:digit:]]/
puts "00a" =~ /[[:alpha:]]/

 

posted @ 2012-05-26 13:51  阿King2088  阅读(297)  评论(0编辑  收藏  举报