C#多线程处理webbrowser及InvokeMember("click")无响应的问题

文章重点:多线程处理webbrowser的相关问题,并解决触发click事件,js无响应问题

最近刚好碰上一个需求:循环遍历网页元素,找到innerText为指定的内容时,就模拟人工点击

解决办法:使用WebBrowser将指定位置的文档加载到 WebBrowser 控件中(注:这里的webbrowser是在拉控件的方式,而不是直接在代码中new)

源码如下:

private void loadPage(object URL)
        {
            try
            {
                string url = (string)URL;               
                browser.Navigate(url);                
                while (true)
                {
                   Application.DoEvents();                
                   if(browser.ReadyState != WebBrowserReadyState.Complete) 
                  {
                        break;
                   }
                }                                
                HtmlDocument document = browser.Document;
                HtmlElementCollection elems = browser.Document.GetElementsByTagName("a");
                foreach (HtmlElement em in elems)
                {
                    if (em.InnerText == "测试")
                    {          
                        em.InvokeMember("click");//"触发点击事件"
                    }
                }
            }
            catch (Exception ex)
            {
                MessageBox.Show(ex.Message);
            }
        }      

有一点没说到,上面的只适合单线程的,如果执行以上代码的是在新开辟的一个线程中的话,会碰到一系列的问题......(很遗憾,我没有将那些问题记录下来,但相信如果你跟我有着同样的需求的话,即采用多线程的方式处理webbrowser加载的网页内容的话,可以继续看下去,也许对你有所帮助)

网上一搜,关于webbrowser在多线程中的使用着实会碰到很多问题……后来,经过自己不断的Google(在这过程中你能体会到百度离Google还有多远),有找到了几篇对我有所帮助的文章:

关于线程的知识:http://www.cnblogs.com/JimmyZheng/archive/2012/06/10/2543143.html

WebBrowser多线程带来的麻烦http://www.cnblogs.com/xjfhnsd/archive/2010/03/14/1685441.html

WebBrowser 显示Html内容3点细节技巧: http://www.cnblogs.com/cyq1162/archive/2012/03/27/2419655.html

 

接着,我就使用webclient配合webbrowser从而顺利的解决了问题。

WebClient:下载指定网址的源码

WebBrowser:navigate一个空白页(具体参考:)

注:这里的WebBrowser要从代码中new,如果是拉控件的方式创建的,将会报错:"指定的转换无效"

这里我就写一个以上列出的文章所没有提到的。

比如,我们要click的网页元素是通过js来触发的,而使用webclient只能下载指定的url的网页源码,无法自动加载相关的js,因此导致在使用invokeMember("click")的时候,没能见到预期效果。

解决办法:将指定的js文件也下载下来(或者将需要用到的js方法放到本地,使用webclient  载入进来也行)

我这里说的只是一个大题的思路和解决途径

最后,贴上一段测试代码:

C#源码:

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using System.Threading;
using System.Net;
namespace webbrowser控件
{
    public partial class Form1 : Form
    {
        public Form1()
        {
            InitializeComponent();
        }
        private void button1_Click(object sender, EventArgs e)
        {
            Control.CheckForIllegalCrossThreadCalls = false;
            ParameterizedThreadStart pt;
            pt = new ParameterizedThreadStart(loadPage);
            Thread td = new Thread(pt);
            td.Name = "主线程";
            td.SetApartmentState(ApartmentState.STA);//在线程启动前设置其单元状态
            td.Start("http://127.0.0.1/test.html");            
        }
        private void loadPage(object URL)
        {
            try
            {
                string url = (string)URL;
                WebBrowser browser = new WebBrowser();//当前线程不在单线程单元中,因此无法实例化 ActiveX 控件
                browser.ScriptErrorsSuppressed = true;
                //browser.Navigate(url);
                //browser.DocumentCompleted += browser_DocumentCompleted;
                browser.Navigate("about:blank");
                string htmlcode = GetHtmlSource(url);
                string js = GetHtmlSource("http://127.0.0.1/MY/test/js.html");//载入js
                browser.Document.Write(js);  
                textBox1.Text = htmlcode;
                //while (browser.ReadyState != WebBrowserReadyState.Complete)  //报错“指定的转换无效”
                //    Application.DoEvents();
                browser.Document.Write(htmlcode);
                //MessageBox.Show(browser.DocumentText);
                HtmlDocument document = browser.Document;
                HtmlElementCollection elems = browser.Document.GetElementsByTagName("a");
                foreach (HtmlElement em in elems)
                {
                    if (em.InnerText == "点击")
                    {          
                        em.InvokeMember("click");//alert("触发点击事件")
                    }
                }
            }
            catch (Exception ex)
            {
                MessageBox.Show(ex.Message);
            }
            finally
            {
                //MessageBox.Show("当前执行线程:"+Thread.CurrentThread.Name);
            }
        }
        //WebClient取网页源码
        private string GetHtmlSource(string Url)
        {
            string text1 = "";
            try
            {
                WebClient wc = new WebClient();

                text1 = wc.DownloadString(Url);
            }
            catch (Exception ex)
            {
                MessageBox.Show(ex.Message);
            }

            return text1;
        }

    }
}

test.html:

<html>
<head>
<title></title>
<script type="text/javascript" src="a.js"></script>
</head>
<body>
<a href="javascript:void();" onclick="t()">点击</a>
</body>
</html>

js:

<script type="text/javascript">
function t()
{
    alert('ddd');
}
</script>

原创文章,转载请注明出处:http://www.cnblogs.com/hongfei/archive/2013/01/05/2846933.html

posted @ 2013-01-05 23:57  曾是土木人  阅读(7976)  评论(1编辑  收藏  举报