几个开放源码网页分析工具
几个开放源码网页分析工具
发表人:mikeamy | 发表时间: 2004年十二月09日, 15:53
几个开放源码网页分析工具
C#
1.htmlagilitypack ()
2.NunitAsp
Java:
1.Htmlparser
2.javax.swing.text.html.parser
一般分析的基本步骤为﹕
1. 下载纲页内容﹐(其中可能会涉及防火墙用户及口令和代理服务器设置)
2. 将纲页html文本转换为xhtml格式文本。
3. 利用xpath和XQuery提取纲页数据。