如何提取网页中所有链接(C++) 转载

IE有几个有用的接口,我们可以用它来提取网页所有链接。

一、基本原理

首先是用IHTMLDocument2的get_links,来获取IHTMLElementCollection接口,再通过IHTMLElementCollection来获取IHTMLAnchorElement,而IHTMLAnchorElement接口的get_href就是我们想要的,通过循环获取,我们就可以得到网页的所有链接了!

二、具体代码

Code

本程序在VC7+WINXP下编译通过,详细请看源代码

posted @ 2009-01-29 23:37  海洋——海纳百川,有容乃大.  阅读(661)  评论(1编辑  收藏  举报