正则表达式匹配
今天项目需要将一段话中网址选出来所以找了一些正则表达式,以后遇到继续增加
1.匹配规范网址:(https?|ftp|file)://[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|],
2,匹配不规范的网址,比如前面没有http://等一些,只是www开头,只需要去掉前面的匹配项就可以了。
[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|],但是数字也会出现,垃圾。
3.自己瞎写的简单正则表达式,只能匹配www.xxx.com这一种的。
w{3}\.[a-zA-Z]+\.[a-z]{2,3}