2013年5月30日
摘要: 写网页抓取应用的时候经常需要解析html页面,此时就需要html解析器。当然可以自己从零开始写一个全新的html parser,但是对于一般的网页分析,使用现成的解析器可能更好(可靠性、稳定性、性能)。java平台下sourceforge上有一个开源的解析器,可以从这里下载:http://htmlparser.sourceforge.net。但是在dot net平台下一直没有很好的开源html解析器,因此通常dot net平台下一般有下面几种解析html网页的方式:1、使用微软的mshtml com组件这种大概在c++语言下用的最多,dot net下也可以使用,添加对mshtml com组件的 阅读全文
posted @ 2013-05-30 01:19 qiulang 阅读(6188) 评论(0) 推荐(1) 编辑