c# 解析html
html源代码结构解析,以抽取特定节点内容:
方案一: 正则表达式
方案二: HtmlAgilityPack库 : HtmlAgilityPack是使用XPath语法,HtmlAgilityPack是一个开源的.NET类库,它的主页是http://htmlagilitypack.codeplex.com/,在这里可以下载到 最新版的类库及API手册,此外还可以下载到一个用于调试的辅助工具。
方案三:Winista.Htmlparser.Net库 : 是.NET平台下解析Html的开源代码,网上有源码下载,百度一下就能搜到,这里就不提供了。并且有英文的帮助文档。
方案四:Jumony是一个开源项目,已经有三年的历史了,在这三年中,秉承提供给.NET程序员完整的HTML掌控能力,Jumony历经无数次的改进,终于进入了一个新的阶段。Jumony Core 3是一个真正意义上的HTML引擎。
http://www.cnblogs.com/Ivony/p/3447536.html
https://github.com/Ivony/Jumony