Dict.CN 在线词典, 英语学习, 在线翻译 ------------- MyGitee 朱秋贵内科诊所 My腾云code

用TOPFISHER采集用__doPostBack()分页的网站数据

用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack()函数来分页,这样就不能直接看到目标网页的参数和地址。

我们可以通过HttpWatch、ieHTTPHeaders、等工具来分析 HTTP 头,从而获取POST数据,找出规律,看看那个是分页参数,一般类似这样的值“__EVENTTARGET=DataGrid3%3A_ctl24% 3A_ctl1”这部分里就有,最后1 就是页号。只是例子。

然后自己写程序POST方式访问此页面,并把这些数据完整的当做POST数据传给这个页面,同时修改分页参数,就可以获取全部网页的数据了。 大概就这思路,你在琢磨琢磨。



YulinCMS(雨林内容管理系统) 是采用微软的.net技术进行架构、功能强大的网站管理软件。用户不需要学习复杂的建站技术,不需要学习太复杂的HTML语言,你就能够利用YulinCMS构建出一个风格统一功能强大的专业网站,大大加快网站的建设周期。


[原创]用TOPFISHER采集用__doPostBack()分页的网站数据

用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack
   ()函数来分页,这样就不能直接看到目标网页的参数和地址。下面我来教大家用TOPFISHER页面辅助分析器,结合TOPFISHER来采集__doPostBack
   ()式分页的页面。

以http://www.ynnw.gov.cn/scxx/schq.aspx这个页面为例:

1.先用TOPFISHER页面辅助分析器打开http://www.ynnw.gov.cn/scxx/schq.aspx;

2.在分析器内的WEB窗口,点击分页中的任意一页;

3.这时候可以看到POST数据窗口中出现了一大堆POST数据;(这些数据就是schq.aspx接收的POST参数,这里我们只需要关注参数中的“__EVENTTARGET=DataGrid3%3A_ctl24%3A_ctl1”这部分,其中的红色部分,其实就是页面的页数)

4.在TOPFISHER脚本中,用PostUrl()函数,来访问这个页面,并把这些数据完整的当做POST数据传给这个页面,然后再用FOR语句,来修改页面参数,就可以完成全部采集了。


http://www.topfisher.com/doc/TPAssistant.rar




c#抓取浏览器网页代码数据(winform)

http://www.cnblogs.com/fhmsha/archive/2007/07/18/822034.html

posted @ 2008-01-18 15:13  cn2024  阅读(651)  评论(0编辑  收藏  举报