摘要: webMagic学习笔记 主页 csdn的WebMagic栏目黄亿华-- webMagic创始人博客 学习第一天:webMagic入门案例,启动流程,及从页面中获取元素,并放到Page对象中,并成功拿出 模拟登陆二: webmagic爬虫自学(六)网络爬虫模拟登陆[策略二:通过Selenium模拟表 阅读全文
posted @ 2020-03-16 18:17 码哥之旅 阅读(450) 评论(0) 推荐(0) 编辑
摘要: webMagic的PageProcessor(页处理器,通过此实现类,可能过css,xpath,json来分析网页中内容)接口实现类知识整理 站点配置成功,可获取网站html内容后, 1:PageProcessor.java接口主要两个方法process()和getSite(), public in 阅读全文
posted @ 2020-03-16 16:04 码哥之旅 阅读(1077) 评论(0) 推荐(0) 编辑