2014年2月12日

使用Jsoup获取网页内容超时设置

摘要: 最近使用Jsoup来抓取网页,并对网页进行解析,发现很好用。在抓取过程中遇到一个问题,有些页面总是报Timeout异常,开始想是不是被抓取网站对IP进行了限制,后来发现用HttpClient可以获取到内容。原来我最开始使用Jsoup.connect(url).get();方法获取网页内容,这种方式使用的是默认超时时间3秒。原来Jsoup是可以设置超时的,修改成如下就可以了:Jsoup.connect(url).timeout(30000).get(); // 30S 阅读全文

posted @ 2014-02-12 18:02 liwp_Stephen 阅读(4243) 评论(1) 推荐(0) 编辑

微信公众平台回复音乐

摘要: 微信回复音乐的接口说明,需要thumb_media_id,但是这个值不知道从哪里获取,在网上查了一下,原来这个字段可以不设置的。网上的回复如下:可以回复音乐,按music结构回复即可。ThumbMediaId可以不填,我正在找怎么在上传素材中找到MediaId -- 不要加到回复的XML中。 阅读全文

posted @ 2014-02-12 17:55 liwp_Stephen 阅读(1639) 评论(0) 推荐(0) 编辑

导航