用正规表现匹配网址
一直以为用正规表现匹配网址是很简单的事情,但是发现正规表现的逆向匹配功能还是不太理想。
例如, 下图中的红线部分,就是把http也当成了前一个url的一部分,想要匹配直到“http:”时结束,这样的匹配就很难了。
正规表现字串: (http|https):\/\/[a-zA-Z][^\./:]*(:\d+)?((\.[^\./ ]+))*(/[^/\. :]+)*/?
当所有http://.... 前面都有空格隔开的时候,可以匹配到所有url, 但是在实际应用中难免会碰到如图这样没有空格隔开的连着的url字符串。
暂时的做法是首先自行插入空格将所有的http(s):隔开,然后再用此pattern匹配。(无奈之举啊。。。)