会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
##
博客园
首页
新随笔
联系
订阅
管理
2019年12月1日
爬取小说并以章节名保存
摘要: 今天我们爬取网页中的文字,与上次的爬取网页中的图片相似,网页的中的文字也是在网页的源码中(一般情况下)。 所以我们就以在某小说网站上爬取小说《圣墟》为例,使用爬虫爬取网页中的文本内容,并根据小说的章节名保存。 我们的思路如下: 1.爬取当前网页的源码: 2.提取出需要的数据(标题,正文) 3.保存(
阅读全文
posted @ 2019-12-01 18:30 杨小平#
阅读(1908)
评论(0)
推荐(1)
编辑
公告