自己收集一些资料,以备用

 

发赛特技术网  《通过解析HTML读取数据

运用SgmlReader类来解析HTML文件,并生成格式规范(well-formed)的HTML.Microsoft的XML大师Chris Lovett最近在gotdotnet网站上发布了一个新的SGML解析器,叫做SgmlReader,它可以解析HTML文件,甚至将它们转换成一个格式规范的结构。SgmlReader派生于XmlReader,这就是说,你可以像运用诸如XmlTextReader这样的类来解析XML文件那样来解析HTML文件。

SGMLReader使用的几个例子
gotDotnet上的例子
Parse HTML with an SGMLReader
HTML to XHTML Conversion with SGMLReader

Chris Lovett相关网站
http://www.lovettsoftware.com/


HTMLParser    http://htmlparser.sourceforge.net/


 两个分析HTML网页的方法

 

posted on 2004-08-31 22:08  zhumk  阅读(1378)  评论(1编辑  收藏  举报