摘要: 思路: 1、 首先是采用curl的方式采集到这个网页的内容 2、 用正则的方式或者html解析器把url分析出来 3、 对于每一个url,进行请求,如果状态不是2xx、3xx等就定义为异常。 转自 http://blog.csdn.net/qq43599939/article/details/781 阅读全文
posted @ 2017-12-17 20:19 yangchunlong 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 豆瓣开放API https://developers.douban.com/wiki/?title=guide 阅读全文
posted @ 2017-12-17 19:38 yangchunlong 阅读(1122) 评论(0) 推荐(0) 编辑