Delphi TWebBrowser[5] 获取含框架的网页完整html源码 及多个框架(跨域)的方法

Delphi TWebBrowser[5] 获取含框架的网页完整html源码 及多个框架(跨域)的方法

1、获取html源码的常规方法:

(WebBrowser1.Document as IHtmlDocument2).body.outerHtml;

2、获取含框架frame的完整html源码(<body>之外如<head>) 

var
  ole_index, oleObj: OleVariant;
  i: integer;
begin
//  if WebBrowser1.Busy then  Exit; //网页加载中,退出。
  with Memo1.Lines do begin   //获取主框架网址及网页源码
    Clear;
    Add(WebBrowser1.OleObject.document.url);
    Add(WebBrowser1.OleObject.document.documentElement.outerHTML);
    Add(' ');  Add(' '); //添加空行
  end;
//循环获取每一个子框架网址及网页源码
  for i := 0 to WebBrowser1.OleObject.document.frames.length - 1 do
  begin
    ole_index := i;
    oleObj := WebBrowser1.OleObject.document.frames.item(ole_index);
    with Memo1.Lines do begin
      Add(oleObj.document.url);
      Add(oleObj.document.documentElement.outerHtml);
      Add(' ');  Add(' '); //添加空行
    end;
  end;
end;  

3、多个框架(跨域)

Uses MsHtml, ActiveX

var i: Integer; ole_index: OleVariant; FrameDis: IDispatch; FrameWin: IHtmlWindow2; psi:IServiceProvider; frameb: IWebBrowser2; pPersist: IPersistStreamInit; ss: TStringStream; str1, str2: String; begin if WebBrowser1.Busy then Exit; Memo1.Lines.Clear; //获取主网页网址 Memo1.Lines.Add(WebBrowser1.OleObject.document.url); //获取主网页源码 Memo1.Lines.Add(WebBrowser1.OleObject.document.documentElement.outerHTML); //添加空行 Memo1.Lines.Add(' '); for i := 0 to WebBrowser1.OleObject.document.frames.length - 1 do begin ole_index := i; FrameDis := (WebBrowser1.Document as IHtmlDocument2).frames.item(ole_index); FrameDis.QueryInterface(IID_IHTMLWindow2, FrameWin) ; if FrameWin = nil then Continue; FrameWin.QueryInterface(IServiceProvider, psi); if psi = nil then Continue; psi.QueryService(IID_IWebBrowserApp,IID_IWebBrowser2,frameb); if frameb=nil then continue; frameb.Document.QueryInterface(IPersistStreamInit, pPersist); if pPersist = nil then Continue; //获取框架页网址 Memo1.Lines.Add((frameb.Document as IHtmlDocument2).url); ss := TStringStream.Create(''); try //获取框架页源码 if Succeeded(pPersist.Save(TStreamAdapter.Create(ss), True)) then begin str1 := ss.DataString; str2 := Utf8ToAnsi(str1); //有些网页使用UTF-8编码方式,不进行转换中文会乱码 if str2 = '' then Memo1.Lines.Add(str1) else Memo1.Lines.Add(str2); end; finally FreeAndNil(ss); end; Memo1.Lines.Add(' '); //添加空行 end; end;

 

  

 

  

 

创建时间:2020.11.23  更新时间:

 

posted on 2020-11-23 08:53  滔Roy  阅读(639)  评论(0编辑  收藏  举报

导航