摘要: webmagic框架是一个java实现的爬虫框架,底层依然是Httpclient和jsoup 四大组件了解 downloader:下载器组件 PageProcessor:页面解析组件(必须自定义) scheduler:访问队列组件 pipeline:数据持久化组件(默认输出到控制台) 入门程序 流程 阅读全文
posted @ 2021-09-03 00:36 Coder-Wang 阅读(300) 评论(0) 推荐(0) 编辑