会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
青红*皂了个白
博客园
首页
新随笔
联系
管理
订阅
2019年3月28日
用crawl spider爬取起点网小说信息
摘要: 起点作为主流的小说网站,在防止数据采集反面还是做了准备的,其对主要的数字采用了自定义的编码映射取值,想直接通过页面来实现数据的获取,是无法实现的。 单独获取数字还是可以实现的,通过requests发送请求,用正则去匹配字符元素,并再次匹配其映射关系的url,获取到的数据通过font包工具解析成字典格
阅读全文
posted @ 2019-03-28 13:05 青红*皂了个白
阅读(816)
评论(0)
推荐(0)
编辑
公告