用正规表现匹配网址

一直以为用正规表现匹配网址是很简单的事情,但是发现正规表现的逆向匹配功能还是不太理想。

例如, 下图中的红线部分,就是把http也当成了前一个url的一部分,想要匹配直到“http:”时结束,这样的匹配就很难了。

正规表现字串:  (http|https):\/\/[a-zA-Z][^\./:]*(:\d+)?((\.[^\./ ]+))*(/[^/\. :]+)*/?

 

当所有http://.... 前面都有空格隔开的时候,可以匹配到所有url, 但是在实际应用中难免会碰到如图这样没有空格隔开的连着的url字符串。

暂时的做法是首先自行插入空格将所有的http(s):隔开,然后再用此pattern匹配。(无奈之举啊。。。)

posted @ 2017-01-12 17:22  waiting4UFO  阅读(256)  评论(0编辑  收藏  举报
waiting4ufo@CN Stud.