随笔 - 39  文章 - 16 评论 - 193 阅读 - 56550

下载
数据采集器,其实很简单,没有想像的那么复杂。
1使用HttpWebRequest或者WebClient获取数据
2 使用正则表达式获取你想要的数据
现在将相关代码贴出来

public static string GetHtml(string begin, string end, string content)
        {
            Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
            Match match = reg.Match(content);

            if (match != Match.Empty)
            {
                //content = content.Replace(match.Groups[1].ToString(), string.Empty);
                return match.Groups[1].ToString();
            }
            else
            {
                return string.Empty;
            }
        }
        public static StringCollection GetHtmls(string begin, string end, string content)
        {
            Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
            MatchCollection  matches = reg.Matches(content);
            StringCollection list=new StringCollection();
            foreach(Match match in matches)           
            {
                if (match != Match.Empty)
                {
                    list.Add(match.Value);
                }
            }
            return list;
        }

示例:获取代理器Ip下载
 

posted on   rosanshao  阅读(1243)  评论(3编辑  收藏  举报
编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
· SQL Server 2025 AI相关能力初探
点击右上角即可分享
微信分享提示