自己收集一些资料,以备用
发赛特技术网 《通过解析HTML读取数据》
运用SgmlReader类来解析HTML文件,并生成格式规范(well-formed)的HTML.Microsoft的XML大师Chris Lovett最近在gotdotnet网站上发布了一个新的SGML解析器,叫做SgmlReader,它可以解析HTML文件,甚至将它们转换成一个格式规范的结构。SgmlReader派生于XmlReader,这就是说,你可以像运用诸如XmlTextReader这样的类来解析XML文件那样来解析HTML文件。
SGMLReader使用的几个例子
gotDotnet上的例子
Parse HTML with an SGMLReader
HTML to XHTML Conversion with SGMLReader
Chris Lovett相关网站
http://www.lovettsoftware.com/
HTMLParser http://htmlparser.sourceforge.net/