2020 年 9月 19 日随笔档案 - 肖祥

2020年9月19日

摘要：一、概述在之前的文章中，一般是抓取某个页面信息。那么如何抓取一整个网站的信息呢？想像一下，首先我们需要解析一个网站的首页，解析出其所有的资源链接（ajax方式或绑定dom事件实现跳转忽略），请求该页面所有的资源链接，再在资源链接下递归地查找子页的资源链接，最后在我们需要的资源详情页结构化数据阅读全文

posted @ 2020-09-19 17:51 肖祥阅读(385) 评论(0) 推荐(0) 编辑

肖祥

公告