大数据挖掘

大数据挖掘

 hjgc2001 2013-01-06 325

这本书已经由剑桥大学出版社出版。如果你购买精装版,可以享受20%的折扣。经出版方同意,你可以免费下载本书。但剑桥大学出版社拥有本书的所有权,如果你希望重印本书的全部或部分章节,需要得到出版社的授权。很遗憾需要特别指出这点,因为据我们目前掌握的证据表明,有人将我们以前在网上公开的书籍更换名字后重新出版。正如本书第三章所述,这种侵权行为是很容易被人发现的。------Anand Rajaraman,Jeff Ullman。

以下内容和2012年7月4日校订的公开版本是一样的。我们目前正在对该书进行修订,这本书将来会一直进行更新。当前版本可称之为V1.1.

下载全书(340页,大约2MB)

分别下载各章节

前言和目录

第一章数据挖掘

第二章大尺度文件系统和Map—Reduce

第三章搜索类似项目

第四章挖掘数据流

第五章链接分析

第六章频率项集

第七章聚类

第八章网络广告

第九章推荐系统

索引

下载V1.2

下述内容仅是大数据挖掘的草稿。这个版本的合作者增加了Jure Leskovec,并增加了一掌新内容。但我们也会考虑增加关于大尺度机器学习算法和降维的内容,也会考虑将map-reduce算法设计增加到第二章里。

在V1.2中,我们对第二章进行了修改,更关注map-reduce算法在实际中的应用,而不仅仅是上一版中的理论描述。我们同样增加了map-reduce算法设计技术方面的内容。

下载本书(415页,大约2.5MB)

分别下载各章节

前言和目录

第一章数据挖掘

第二章Map—Reduce和新软件栈

第三章搜索类似项目

第四章挖掘数据流

第五章链接分析

第六章频率项集

第七章聚类

第八章网络广告

第九章推荐系统

第十章挖掘社交网络

索引

对Gradiance的支持

如果你是一名教职人员,正在配合本书使用Gradiance Automated Homework System系统,那请首先在www.gradiance.com/services进行注册。然后,通过邮件将您的用户名和希望使用本书的请求发送到support@gradiance.com,接着您就可以使用本书作为教材了。您可以在www.gradiance.com/info上找到如何使用本书的帮助手册。希望自学的学生可以在www.gradiance.com/services上进行注册。然后使用令牌1EDD8A1D加入“普通班”进行学习。利用学生引导获得更多帮助。

其他人员

  • 课程CS246的教材Jure的资料
  • 幻灯片和CS345A的课程教材。欢迎喜欢本书的可以随意使用这些资料,但请保留我们的著作权。
  • 精装版的勘误表。请随时关注新版本的发布。注意,每个版本都有相应的分节下载,请检查你下载的版本是否包含最新的勘误表。如有问题,请联系ullman@gmail.com

转自  http://article.yeeyan.org/view/265411/342239

posted @ 2013-01-07 08:21  renly2013  阅读(310)  评论(0编辑  收藏  举报