傻傻de

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2018年11月30日

摘要: 程序爬取目标 获取博客园精华区文章的 标题、标题链接、作者、作者博客主页链接、摘要、发布时间、评论数、阅读数和推荐数, 并存储到 MongoDB 中。 程序环境 已安装scrapy 已安装MongoDB 创建工程 在命令提示符中执行上述命令后,会建立一个名为 的文件夹。 创建爬虫文件 执行上述命令后 阅读全文
posted @ 2018-11-30 21:44 傻傻de 阅读(738) 评论(0) 推荐(0) 编辑