摘要:
一、分析背景: 1,为什么要选择虎嗅 「关于虎嗅」虎嗅网创办于 2012 年 5 月,是一个聚合优质创新信息与人群的新媒体平台。 2,分析内容 分析虎嗅网 5 万篇文章的基本情况,包括收藏数、评论数等; 发掘最受欢迎和最不受欢迎的文章及作者; 分析文章标题形式(长度、句式)与受欢迎程度之间的关系; 阅读全文
摘要:
什么是scrapy Scrapy 是用纯 Python 实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛。框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便。Scrapy 使用了 Twisted['twɪstɪd](其主要对 阅读全文