htmlagilitypack的简单使用

1.新建一个web页。

2.添加引用,引入htmlagilitypack。

3.代码

protected void Page_Load(object sender, EventArgs e)
        {
            HtmlWeb htmlWeb = new HtmlWeb();
            //实例化HtmlAgilityPack.HtmlDocument对象,并载入html页
            HtmlDocument htmlDoc = htmlWeb.Load(@"你的url");
            //根据XPATH来索引节点
            HtmlNodeCollection anchors = htmlDoc.DocumentNode.SelectNodes("你需要的html内容的xpath");
            foreach (HtmlNode anchor in anchors)
            Response.Write(anchor.InnerHtml + "<br/>");
            Response.End();
        }

HtmlWeb类是一个从网络上获取一个HTML文档的类,其提供的功能大多是基于完成此需求出发。

HtmlDocument类对应着一个HTML文档代码。它提供了创建文档,装载文档,修改文档等等一系列功能。

posted @ 2018-01-13 17:08  莽原一顾  阅读(1668)  评论(0编辑  收藏  举报