会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
破雷
2019年11月20日
爬取漫画
摘要: 网页的爬取方式主要分为两种。 1. 模拟Http请求,分析获取的json内容或者html内容,进行分析得到想要的数据。由于要读取内容,所以该方式适用于内容结构简单,不涉及到内容加密的场景。 2.模拟用户操作行为(如输入内容、点击按钮)来获取内容。所有的操作都是模拟用户行为,所以可以适用于内容加密的场
阅读全文
posted @ 2019-11-20 22:08 破雷
阅读(923)
评论(1)
推荐(0)
编辑
导航
博客园
首页
新随笔
联系
订阅
管理
公告