简单爬虫
使用HtmlAgilityPack来开发简单爬虫:
1、NuGet安装HtmlAgilityPack
2、简单的爬虫代码
HtmlWeb web=new HtmlWeb(); string url="网站地址"; var doc = web.Load(url); //使用并行查询来获取元素的属性值 IList<string> detailPageUrls = new List<string>(); doc.DocumentNode.SelectNodes("//a[@class='js-title value title-font']") .AsParallel().ToList().ForEach(hn => { string detailPageurl = hn.GetAttributeValue("href", string.Empty); if (!string.IsNullOrWhiteSpace(detailPageurl)) { detailPageUrls.Add(detailPageurl); } });
官网地址:https://html-agility-pack.net/
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步