2019 年 12月 1 日随笔档案 - 杨小平#

2019年12月1日

摘要：今天我们爬取网页中的文字，与上次的爬取网页中的图片相似，网页的中的文字也是在网页的源码中（一般情况下）。所以我们就以在某小说网站上爬取小说《圣墟》为例，使用爬虫爬取网页中的文本内容，并根据小说的章节名保存。我们的思路如下： 1.爬取当前网页的源码： 2.提取出需要的数据（标题，正文） 3.保存（阅读全文

posted @ 2019-12-01 18:30 杨小平# 阅读(1908) 评论(0) 推荐(1) 编辑

##

公告