《正则指引》学习笔记
# encoding:UTF-8 #---------------------------------- 字符组 -------------------------------------------------------- =begin #1、识别GBK编码时,需要使用Unicode编码环境,在源文件顶部指定 # encoding:UTF-8 #2、ruby 1.8,正则表达式中有非ASCII字符,则最好在表达式末尾写上u显示指定Unicode模式 =end puts "罚" =~ /[收发]/u # nil puts "发" =~ /[收发]/u # 0 =begin #1、ruby 1.8,匹配位置按照字节计算,UTF-8编码每个汉字占3个字节 =end puts "我发" =~ /[收发]/u # 3 =begin #1、ruby 1.8,POSIX字符组只能匹配ASCII字符,而且不可使用[:ascii:]、[:word:] =end puts "0" =~ /[[:digit:]]/ puts "00a" =~ /[[:alpha:]]/