获取HTML中所有图片的 URL

/// <summary>
        /// 获取HTML中所有图片的 URL
        /// </summary>
        /// <param name="strHtml">HTML代码</param>
        /// <returns>图片的URL列表</returns>
        public static string[] GetHtmlImageUrlArr(string strHtml)
        {
            // 定义正则表达式用来匹配 img 标签   
            Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);

            // 搜索匹配的字符串   
            MatchCollection matches = regImg.Matches(strHtml);
            int i = 0;
            string[] sUrlarr = new string[matches.Count];

            // 取得匹配项列表   
            foreach (Match match in matches)
                sUrlarr[i++] = match.Groups["imgUrl"].Value;
            return sUrlArr;
        }

 

posted @ 2019-08-17 05:35  杜子烟  阅读(1170)  评论(0编辑  收藏  举报