摘要: 原文http://www.cnblogs.com/xiaoyao2011/archive/2011/09/25/2190013.html一般来说一个 HTML 文档有很多标签,比如“<html>”、“<body>”、“<table>”等,想把文档中的img 标签提取出来并不是一件容易的事。由于img 标签样式变化多端,使提取的时候用程序寻找并不容易。于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出来的不是正确的img 标签。我们可以从 HTML 标签的格式去想应该怎么建这个正则表达式。首先要想一下img 标签有几种写法,忽略大 阅读全文
posted @ 2012-06-18 15:46 Jack.Y 阅读(532) 评论(0) 推荐(0) 编辑