2021年2月26日

发表于 2021-02-26 08:59阅读：1690评论：0推荐：3

摘要：上一章节中我们实现了对优酷单页面的爬取，简单进行回顾一下，使用HtmlAgilityPack库，对爬虫的爬取一共分为三步爬虫步骤加载页面解析数据保存数据继第一篇文档后的爬虫进阶，本文章主要是对上一篇的进阶。实现的功能主要为： 1、爬取电影类别列表 2、循环每个类别的电影信息，对每个类别的信阅读全文 »

posted @ 2021-02-26 08:59 三十三重天阅读(1690) 评论(0) 推荐(3) 编辑

手把手教你爬取优酷电影信息 -1

发表于 2021-02-26 08:49阅读：775评论：0推荐：1

摘要：爬虫的制作主要分为三个方面 1、加载网页结构 2、解析网页结构，转变为符合需求的数据实体 3、保存数据实体（数据库，文本等）在实际的编码过程中，找到了一个好的类库“HtmlAgilityPack”。介绍：官网：http://html-agility-pack.net/?z=codeplex H 阅读全文 »

posted @ 2021-02-26 08:49 三十三重天阅读(775) 评论(0) 推荐(1) 编辑