mysql-用正则表达式进行搜索

  正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较,mysql允许你指定正则表达式,过滤select检索出的数据。但是mysql仅仅支持正则表达式的一个子集。

  1、基本字符匹配:

    select prod_name from products where prod_name regexp '1000' order by prod_name;

    以上语句检索到prod_name包含文本1000的所有行。在regexp后面所跟的东西作为正则表达式处理。但是正则的好处还有,如下:

    select prod_name from products where prod_name regexp '.000' order by prod_name;

    这里的.000表示匹配任意一个字符,当然1000和2000都匹配且返回。

    like 和 regexp的区别:like匹配整个列,如果匹配的文本在列值中出现,mysql将不会找到它。而regexp在列值类进行匹配,如果被匹配的文本在列值中出现,regexp将会找到它。但是regexp能否用来匹配整个列值,我们使用和$定位符即可。

 

  2、进行or匹配

    为搜索两个串(或者为这两个串,或者为另一个串),使用|,如下:

    select prod_name from products where prod_name regexp ‘1000|2000’ order by prod_name;

    类似where匹配中的OR子句。可以将多个or条件并入一个正则表达式。

    

  3、匹配几个字符之一:

    如果你只想匹配特定字符,可通过制定一组用[和]括起来的字符来完成,如下:

    select prod_name from products where prod_name regexp '[12]ton' order by prod_name

    上述语句的意思是匹配1或2,因此1ton和2ton都匹配且返回。其中[12]等效于[1|2]。但是如下:

    select prod_name from products where prod_name regexp '1|2|3ton' order by prod_name;

    以上语句的结果是错误的,因为你让mysql检索的是1或2或3ton,所以他的结果是错误的。所以需要用[]括起来再与其他进行连接起来匹配。

    也可以使用[^12],匹配除这些字符外的任何东西。

 

   4、匹配范围:集合可用来定义要匹配的一个或多个字符,如下:[0123456789]

     以上语句的等效语句是[0-9],我们可使用-来定义范围,范围不限于完整的结合,如[1-3][6-9]也是合法的范围,范围也不一定只是数值的,[a-z]匹配任意字母字符。

     select prod_name from products where prod_name regexp '[1-5]ton' order by prod_name;

     以上主要匹配1-5的数据。

  

   5、匹配特殊字符:如果你需要特殊匹配出现在正则表达式中的这些特殊字符怎么办?如下我们想匹配.这个字符。

    select vend_name from vendors where vend_name regexp '\\.' order by vend_name;

    这里使用了转义,正则中一些具有特殊含义的字符均可以使用其进行转义。包括.、|、[]等,\\也可以用来引用元字符(具有特殊含义的字符),如下:

    \\f                  换页

    \\n         换行

    \\r          回车

    \\t          制表

    \\v         纵向制表

    但是如果我们为了匹配\,我们需要使用\\

 

  6、匹配字符类:我们还可以使用你自己经常使用的数字、所有字母或所有数字字母字符等的匹配。我们可以使用预定义字符集,成为字符类,如下: 

    select prod_name from products where prod_name regexp '[[:digit:]]{4}' order by prod_name;

    [:alnum:]   任意字母和数字  (a-z A-Z  0-9)

    ['alpha:]     任意字符(a-z A-Z)

    [:blank:]     空格和制表[\\t]

    [:cntrl:]       ASCII控制字符[ascii 0-31和127]

    [:digit:]       任意数字[0-9]

 

  7、匹配多个实例:我们之前使用的正则表达式都试图匹配单词出现,如果存在一个匹配,该行被检索出来,如果不存在,检索不出任何行。但是,例如,如果我们需要寻找所有的数,不管数中包含多少数字,或者你可能想寻找一个单词并且还能够适应一个未遂的s、

    select prod_name from products where prod_name regexp '\\([0-9] sticks?\\)' order by prod_name;

    以上语句的正则表达的含义是匹配在括号内的0-9之间的sticks,可以有s,也可以没有s,这是根据?的解释

    *      0个或多个匹配

    +        1个或多个匹配

    ?       0个或1个匹配

    {n}                   指定数目的匹配

    {n,}                不少于指定数目的匹配

    {n,m}               匹配数目的范围

  select prod_name form products where prod_name regexp '[[:digit:]]{4}' order by prod_name;

  以上语句匹配的是匹配连在一起的是个数字

  

  8、定位符:之前都是匹配一个串中任意位置的文本,为了匹配特定位置的文本,需要如下的定位符。

  例如,你想找出一个数(包括以小数点开始的数)开始的所有产品,我们只能使用定位符。如下:

  select prod_name from products where prod_name regexp '^[0-9\\.]' order by prod_name;

  以上语句表达的是只在.或者任意数字为串中第一个字符时才匹配。

  ^文本开始

  $文本结尾

  [[:<:]]  词的开始

  [[:>:]]  词的结尾

posted @ 2018-01-24 19:47  彩电  阅读(176)  评论(0编辑  收藏  举报