组装http报文调用小黄鸡网页端消息接口

小黄鸡网页端 消息 接口 http报文

作者:http://www.cnblogs.com/hdl1992/

 

之前看过一篇博文(http://www.cnblogs.com/txw1958/archive/2013/02/07/weixin-if8-simsimi.html)也是调用小黄鸡网页端的消息接口,但是他的做法是直接用GET请求调用,但这样会被检测出来,导致不会返回正确的数据,只会返回{"response":"SimSimi is tired, I only can speak 200 time a day. Please visit again tomorrow. See ya~ ","id":1,"result":100,"msg":"OK."},原因应该是调用这个接口有限制。虽然直接用GET请求不行,但可以组装完整的http报文后在发送GET请求。

但在这之前需要做些准备工作——用wireshark这款软件抓取在小黄鸡网页端发送消息时的数据包。抓包情况如下:

发送消息的包

主要是看cookie的内容,因为太长了贴图看不到,后来经过试验得出cookie要包括这几个变量:sagree、selected_nc、JSESSIONID、AWSELB

接收消息的包

可以看出返回的数据是一个json数据

做到这里就可以组装一个完整的http报文调用小黄鸡的消息接口了,不过在这之前最好了解下http报文的格式。我是用php的curl功能进行调用,整个流程代码如下:

 1 <?php
 2 function simsimiHttp($keyword)
 3 {
 4     $JSESSIONID = 'JSESSIONID=B86064A18BB84AB21DF283963671E42C';
 5     $AWSELB = 'AWSELB=15E16D030EBAAAB8ACFf4BD9BB7E0CA8FB501388662941563CCCE3FBA00C1966E7EFC7E79C02
 6                       70B337A9EB2DC66B3E19A07708673470FDFA0B2C01AB735E6CC2ABE3DC5F3AF';
 7     //模拟http报文发送消息
 8     $ch = curl_init('http://www.simsimi.com/func/req?lc=ch&msg='.$keyword);
 9     $header = array("Accept: application/json, text/javascript, */*; q=0.01",
10                         "X-Requested-With: XMLHttpRequest",
11                         "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)
12                                      Chrome/27.0.1453.116 Safari/537.36",
13                         "Content-Type: application/json; charset=utf-8",
14                         "Referer: http://www.simsimi.com/talk.htm",
15                         "Accept-Encoding: gzip,deflate,sdch",
16                         "Accept-Language: zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3",
17                         "Cookie: sagree=true; ".$AWSELB."; selected_nc=ch; ".$JSESSIONID,
18                         "Connection: keep-alive"
19                         );
20     
21     curl_setopt($ch, CURLOPT_HTTPHEADER, $header);
22     curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_1);
23     curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
24     $data = curl_exec($ch);
25     curl_close($ch);
26     
27     return $data;
28 }
29 
30 //转义特殊字符
31 function changeSpecialCharacter($str)
32 {                                          
33     $str = str_replace(' ', '%20', $str);
34     $str = str_replace('@', '%40', $str);
35     $str = str_replace('#', '%23', $str);
36     $str = str_replace('%', '%25', $str);
37     $str = str_replace('&', '%26', $str);
38     $str = str_replace('(', '%28', $str);
39     $str = str_replace(')', '%29', $str);
40     $str = str_replace('+', '%2B', $str);
41     $str = str_replace('=', '%3D', $str);
42     $str = str_replace('<', '%3C', $str);
43     $str = str_replace('>', '%3E', $str);
44     $str = str_replace('"', '%22', $str);
45     $str = str_replace(',', '%2C', $str);
46     $str = str_replace('/', '%2F', $str);
47     $str = str_replace(':', '%3A', $str);
48     $str = str_replace(';', '%3B', $str);
49     $str = str_replace('?', '%3F', $str);
50     $str = str_replace('\\', '%5C', $str);
51     $str = str_replace('|', '%7C', $str);
52 
53     return $str;
54 }
55 
56 $keyword = 'hello world';
57 echo simsimiHttp(changeSpecialCharacter($keyword));
58 ?>  

其中simsimiHttp是组装报文调用小黄鸡消息接口的函数,其中最主要的是仿造上面抓取的发送消息包的格式构造正确的http请求报文头。值得注意的是因为我们是用GET请求调用接口,需要把我们发送的消息添加到请求的url中,因此需要发送的消息中的特殊字符(例如空格,<,>这些字符)转义成正确的形式,所以要有changeSpecialCharacter这个函数。以上代码调用的结果为{"response":"侬好","id":24444807,"result":100,"msg":"OK."}。一开始还担心cookie的有效期的问题,但后来总结出不用担心这个问题,甚至不用担心cookie变量的值是否正确,只需要cookie包含那几个变量。

不过这个做法的效率不是很高,可能是因为小黄鸡的服务器在国外的原因,平均一次调用需要1秒左右的时间(在新浪SAE估计更慢)。

效率测试——使用Apache的ab功能,用10个并发完成30请求, 命令行为“ab -n 30 -c 10 http://localhost/test.php”,结果如下

因此,对响应速度要求比较高的应用不推荐使用这种做法。不过也可以尝试使用国外的服务器,这样的话响应速度应该会提高不少。

 

 

posted on 2013-08-17 12:04  怎么吃都好吃  阅读(1801)  评论(0编辑  收藏  举报