会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大师兄的博客
过早退出是一切失败的根源
博客园
首页
新随笔
联系
订阅
管理
2018年5月20日
豆瓣书籍数据爬取与分析
摘要: 前言 17年底,买了清华大学出版社出版的《Hadoop权威指南》(第四版)学习,没想到这本书质量之差,超越我的想象,然后上网一看,也是骂声一片。从那个时候其就对出版社综合实力很感兴趣,想通过具体数据分析各个出版社的出版质量,另外借此也可以熟悉大数据生态和相关操作。 豆瓣上的书籍数据刚好可以满足需求,
阅读全文
posted @ 2018-05-20 16:09 大师兄啊哈
阅读(8098)
评论(0)
推荐(1)
编辑
公告