高软玩家

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

https://files.cnblogs.com/files/qc-id-01/HtmlAgilityPack.rar

                         <tr>
                          <td  bgcolor="#FFFFFF" class="style16"><input name="checked" type="checkbox" id="checked" onclick="Checked(form)" value="3341"</td>
                          <td  bgcolor="#FFFFFF" class="style1">123</td>
                          <td  bgcolor="#FFFFFF" class="style5">234</td>
                          <td  bgcolor="#FFFFFF" class="style7">33</td>
                          <td  bgcolor="#FFFFFF" class="style11">33</td>
                          <td  bgcolor="#FFFFFF" class="style11">33</td>
                          <td  bgcolor="#FFFFFF" class="style13">33</td>
                          <td  bgcolor="#FFFFFF" class="style13">33</td>
                          <td  bgcolor="#FFFFFF" class="style15"></td>
                          <td  bgcolor="#FFFFFF" class="style15">44</td>
                        </tr>

 

string html = "html代码";
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
            doc.LoadHtml(html);
            foreach (HtmlNode table in doc.DocumentNode.SelectNodes(格式))
            {
                foreach (HtmlNode row in table.SelectNodes("//tr[2]//td[1]//tr[2]//tr"))
                {
                    row.SelectSingleNode("td[1]//input").Attributes[value].Value.Trim();
                    row.SelectSingleNode(td[3]).InnerText.Trim();
                }
            }

 

样例://table[1]//table

         //tr[2]//td[1]//tr[2]//tr

 解析:   //代表子标签       []代表标签中的第几个

row.SelectSingleNode(1).Attributes[2].Value.Trim() 代表 tr中 的 第一个 td 中的 input 标签中的 value的值
row.SelectSingleNode(td[3]).InnerText.Trim() 代表 获取tr中的第三个 td 的innerText(<td></td>)中的数据

获取bgcolor 的数据 则可以用使用 row.SelectSingleNode(td[3]).Attributes[bgcolor].Value
posted on 2017-10-25 18:53  高软玩家  阅读(291)  评论(0编辑  收藏  举报