Regular Expression--Good parts

匹配URL的正则表达式

<!doctype html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Regular Expression</title>
<style>
</style>
</head>
<body>
<div id="content">

</div>
<script>
var parse_url = /^(?:([A-Za-z]+):)?(\/{0,3})([0-9.\-A-Za-z]+)(?::(\d+))?(?:\/([^?#]*))?(?:\?([^#]*))?(?:#(.*))?$/;
var url = "http://www.ora.com:80/goodparts?q#fragment";
var result = parse_url.exec(url);
var names = ['url','scheme','slash','host','port','path','query','hash'];
var blanks = ' ';//7个
var i;
for(i = 0; i < names.length; i += 1){
document.writeln('<pre>' + names[i] + ":" + blanks.substring(names[i].length),result[i] + '</pre>');
}

</script>
</body>
</html>

结果:p65

url:    http://www.ora.com:80/goodparts?q#fragment
scheme: http
slash:  //
host:   www.ora.com
port:   80
path:   goodparts
query:  q
hash:   fragment

1、scheme:http://www.cnblogs.com/darr/p/4490330.html

2、pre标签 

定义和用法:

pre 元素可定义预格式化的文本。被包围在 pre 元素中的文本通常会保留空格和换行符。而文本也会呈现为等宽字体。

<pre> 标签的一个常见应用就是用来表示计算机的源代码。

可以导致段落断开的标签(例如标题、<p> 和 <address> 标签)绝不能包含在 <pre> 所定义的块里。尽管有些浏览器会把段落结束标签解释为简单地换行,但是这种行为在所有浏览器上并不都是一样的。

提示和注释:

提示:制表符(tab)在 <pre> 标签定义的块当中可以起到应有的作用,每个制表符占据 8 个字符的位置。但是我们不推荐使用它,因为在不同的浏览器中,Tab 的实现各不相同。在用 <pre> 标签格式化的文档段中使用空格,可以确保文本正确的水平位置。

提示:如果您希望使用 <pre> 标签来定义计算机源代码,比如 HTML 源代码,请使用符号实体来表示特殊字符,比如 "&lt;" 代表 "<","&gt;" 代表 ">","&amp;" 代表 "&"。

提示:在 W3School 中,非常多页面中的源代码实例都是通过 <pre> 标签定义的,您可以参考这些页面,学习如何使用该标签。我们甚至把 <pre> 标签与 <code> 标签结合起来使用,以获得更加精确的语义。

3、用substring控制输出格式对齐

“aa    |”

“bbb  |”

blanks = "  ";//相同的总长度

a + blanks.substring(a.length)

4、exec()

该方法是专门为捕获组设计的。返回数组或null。(p106高)

数组:第一项是与整个模式匹配的字符串。

         其他项是与模式中的捕获组匹配的字符串。

5、非捕获型分组

(?:...)表示一个非捕获型分组。

 通常用非捕获分组来替代少量不优美的捕获型分组是很少的方法,因为捕获会有性能上的损失。 ??

  一般的分组()即括号中没有?:的使用时regexp对象都会将分组内匹配到的内容记录下来。
  RegExp.$1--RegExp.$9,分别用于存储9个匹配的捕获组。
var text = "this has been a short summer";
var pattern = /(..)or(.)/g;
pattern.test(text);
alert(RegExp.$1)//sh

var pattern2 = /(?:..)or(.)/g;
pattern2.test(text);
alert(RegExp.$1);//t

6、test()

  在只想知道目标字符串与某个模式是否匹配,但不需要知道其文本内容的情况下,使用这个方法非常方便。因此,test()方法经常被用在if语句中。

   (test方法是使用正则表达式的最简单(和最快)的方法。不要对这个方法使用g标识)

   因为会出问题:

var pattern1 = /.at/gi
pattern1.test("aaaaat")//true pattern1.lastIndex 6
pattern1.test("aaaaatffff")//false

[在创建正则表达式对象时如果使用了“g”标识符或者设置它了的global属性值为ture时,那么新创建的正则表达式对象将使用模式对要将要匹配的字符串进行全局匹配。在全局匹配模式下可以对指定要查找的字符串执行多次匹配。每次匹配使用当前正则对象的lastIndex属性的值作为在目标字符串中开始查找的起始位置。lastIndex属性的初始值为0,找到匹配的项后lastIndex的值被重置为匹配内容的下一个字符在字符串中的位置索引,用来标识下次执行匹配时开始查找的位置。如果找不到匹配的项lastIndex的值会被设置为0。当没有设置正则对象的全局匹配标志时lastIndex属性的值始终为0,每次执行匹配仅查找字符串中第一个匹配的项。可以通下面的代码来查看在执行匹配相应的lastIndex 属性的值。(http://www.111cn.net/wy/js-ajax/45139.htm)]

 

匹配数字的正则表达式

var parse_number = /^-?\d+(?:\.\d*)?(?:e[+\-]?\d+)?$/i;
parse_number.test("1");//true
parse_number.test("2E+2")//true

我们的模式中唯一可能出现的字母是e,我们用了标识符i。匹配e或E。

 1/^$/i

  我们用^和$来框定这个正则表达式。它指引这个正则表达式对文本中的所有字符都进行匹配。如果省略了这些标识,那么只要一个字符串包含一个数字,这个正则表达式就会进行匹配。有了这些标识,只有当一个字符串的内容仅为一个数字时,它才会告诉我们。

2.正则表达式的量词

 

正则表达式中量词有下面六种:

 

?表示0次或1次

 

* 表示0次或0次以上

 

+ 表示1次活1次以上

 

{n} 表示正好n次

 

{n,m} 表示n-m次

 

{n,}表示n次以上

如果只有一个量词,表示趋向于贪婪性匹配,即匹配尽可能多的副本直至达到上限。

如果这个量词附加?,则表示趋向于进行非贪婪匹配,即只匹配必要的副本。

一般情况下最好坚持使用贪婪性匹配。

 

posted @ 2015-05-09 16:37  darr  阅读(185)  评论(0编辑  收藏  举报