CefSharp获取页面Html代码的两种方式

CefSharp在NuGet的简介是“The CefSharp Chromium-based browser component”,机翻的意思就是“基于Cefsharp Chromium的浏览器组件”

 

第一种方法 就是执行JavaScript代码获取当前html代码

StringBuilder sb = new StringBuilder();
                    sb.AppendLine("function tempFunction() {");
                    //sb.AppendLine(" return document.body.innerHTML; "); 
                    sb.AppendLine(" return document.getElementsByTagName('html')[0].innerHTML; ");
                    sb.AppendLine("}");
                    sb.AppendLine("tempFunction();");
                    var task01 = browser.GetBrowser().GetFrame(browser.GetBrowser().GetFrameNames()[0]).EvaluateScriptAsync(sb.ToString());
                    task01.ContinueWith(t =>
                    {
                        if (!t.IsFaulted)
                        {
                            var response = t.Result;
                            if (response.Success == true)
                            {
                                if (response.Result != null)
                                {
                                    string resultStr = response.Result.ToString();
                                }
                            }
                        }
                    });

 

第二种方法 是利用CefSharp.IFrame.GetSourceAsync()方法

/// <summary>
        /// 页面加载结束
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="e"></param>
        private void Browser_FrameLoadEnd(object sender, FrameLoadEndEventArgs e)
        {
            var task02 = e.Frame.GetSourceAsync();
            task02.ContinueWith(t =>
            {
                if (!t.IsFaulted)
                {
                    string resultStr = t.Result;
                }
            });
        }

我这里是在Browser_FrameLoadEnd事件中直接获取的IFrame,

GetSourceAsync()方法我简单翻译了一下

        //
        // 摘要:
        //     Retrieve this frame's HTML source as a string sent to the specified visitor.
        //     检索此框架的HTML源代码以字符串形式发送给指定访问者。
        //
        // 返回结果:
        //     a System.Threading.Tasks.Task`1 that when executed returns this frame's HTML
        //     source as a string.
        //     一个线程任务,执行时将此框架的HTML源文件作为字符串返回。
        Task<string> GetSourceAsync();

 

posted @ 2019-03-06 17:43  蒲公英C  阅读(14229)  评论(0编辑  收藏  举报