QQ壁纸站图片分析及下载
最近比较喜欢QQ壁纸站(http://style.qq.com/bizhi/)的一些壁纸,不能不说腾讯精心设计的壁纸比一些小站搜集的要强很多.
要下载图片主要就是分析图片链接规则,现在看一个图片地址(http://imgcache.qq.com/club/item/wallpic/items/7/2357/c_1280_800_2357.jpg)
OK,前面http://imgcache.qq.com/club/item/wallpic/items部分很明显是文件夹路径,那么后面的1280_800是我们的屏幕分辨率.很简单.剩下的部分就得靠总结规律了./7/2357/c_1280_800_2357.jpg里面的2357出现了2次,我大胆推测以下他就是图片ID,多打开几个壁纸后就会发现"c_"其实就是有日历版跟无日历版的区别.那么items/7/2357/的中间部分是什么呢.我们多找几个地址看一下:
http://imgcache.qq.com/club/item/wallpic/items/2/2322/1280_800_2322.jpg
http://imgcache.qq.com/club/item/wallpic/items/8/2338/1280_800_2338.jpg
http://imgcache.qq.com/club/item/wallpic/items/4/2324/1280_800_2324.jpg
感觉跟ID的最后一位比较接近.那么按照这个思路总结下来,QQ壁纸图片的生成规则就是:
http://imgcache.qq.com/club/item/wallpic/items/(ID%10)/ID/[C_]Resolution_ID.jpg
分析玩地址再分析下他的列表页:http://style.qq.com/bizhi/list.html?type=all&typeid=0&page=1
通过c#直接读取列表页地址结果发现没有任何关于图片的内容,那么这个列表有可能就是JS加载并生成的.
通过HTTPFOX发现了这么个地址http://imgcache.qq.com/club/item/wallpic/json/all/1/0_1.js里面包含了关于图片ID及描述的JSON内容.
现在就很简单了,这个JSON的地址其实也是跟页码及页码的余数组合而成.
剩下的就是通过循环抓取所有页码的数据包然后读取里面的相关图片信息,生成图片路径下载就OK了
string d = @"http://imgcache.qq.com/club/item/wallpic/items/{0}/{1}/1024_768_{1}.jpg"; for (int i = 119; i < 174; i++) { HttpWebRequest request = HttpWebRequest.Create(createJsonUrl(i)) as HttpWebRequest; Regex regex = new Regex(@"\d{4}", RegexOptions.Compiled); HttpWebUtil.InitHttpRequest(request, new CookieContainer()); using (HttpWebResponse response = request.GetResponse() as HttpWebResponse) { string responseContent = HttpWebUtil.ReadResponseContent(response, Encoding.UTF8); foreach (Match item in Regex.Matches(responseContent, "\"id\":\"\\d{4}")) { string id = Regex.Match(item.Value, @"\d{4}").Value; string url = string.Format(d, (int.Parse(id) % 10), id); } } }