【NLP_Stanford课堂】正则表达式

  1. 或者
    1. [Ww]oods,方括号里的是或的关系,符合其一即被提出。用来匹配单个字符
      1. [A-Z]:表示所有的大写字母之一
      2. [a-z]:表示所有的小写字母之一
      3. [0-9]:表示所有的0-9的数字之一
      4. 否定:[^A-Z]表示不是任何大写字母,在开头否定方括号里的所有内容。
        • [^e^]:表示不是e也不是^
        • a^b:
    2. a|b,用|来表示或,不需要框起来,相当于[abc],可以是长单词 yours|mine
  2. 匹配次数
    1. ?表示?前面的那个字符可以出现或者不出现
    2. *表示*前面的那个字符可以出现0次或者多次
    3. +表示+前面的那个字符可以出现1次或者多次
    4. .表示匹配任何一个单词都可以,但是只能出现一次
    5. {2,4}表示前面的那个字符可以出现2-4次
  3. 匹配字符串的开头和结尾,字符串是指输入的整个字符串
    1. 开头:^[A-Z]匹配以A-Z字母为开头的字符串
    2. 结尾:[A-Z]$匹配以A-Z字母为结尾的字符串
    3. 但是不知道为什么把整篇文章作为了一个字符串,导致匹配结果如下:
    4.  

posted @ 2018-07-29 16:05  A_Present  阅读(297)  评论(0编辑  收藏  举报