c# 【电影搜索引擎】采集电影站源码
最近在做一个聚合搜索引擎,根据电影名,得到资源链接, 并且必须和自己的QQ电影资源机器人兼容, 根据电影名自动回复电影链接。
资源网站:http://www.wxtv.net/api.php/provide/vod/?ac=list&wd=电影关键词, 可根据该站提供的API接口, 得到json数据。
比如, https://www.wxtv.net/api.php/provide/vod/?ac=list&wd=鬼吹灯, 可以得到json格式, vod_id是电影ID, vod_name:电影名称,vod_time:更新时间。
拿到json数据后, 可通过Jobject解析这个json, 拼接出该站的具体url。
核心代码如下:
1 StringBuilder result = new StringBuilder(); 2 msg = ReplaceTitle(msg); 3 msg = Regex.Replace(msg, "[ \\[ \\] \\^ \\-_*×――(^)(^)$%~!@#$…&%¥—+=<>《》!!???::•`·、。,;,.;\"‘’“”-]", ""); 4 string html = HttpClientGetHtmls("https://www.wxtv.net/api.php/provide/vod/?ac=list&wd=" + msg); 5 JObject model = JObject.Parse(html); //解析json 6 if (model != null) 7 foreach (var item in model["list"]) 8 { 9 var id = item["vod_id"]; 10 var dyname = item["vod_name"]; 11 string url = "https://www.wxtv.net/voddetail/" + id + ".html?formQQ=" + formqq; 12 var s = SinaShortUrl(url); 13 result.Append(dyname + ":" + s + "\r\n"); 14 } 15 return result.ToString();