【好书推荐】推荐一份从入门到进阶的机器学习书单

今天推荐的图书专注机器学习主题,一共7本,都是经过实践检验的好书——《机器学习》《图解机器学习》《机器学习实战》《机器学习系统设计》《Spark机器学习》《Mahout实战》《机器学习实践:测试驱动的开发方法》。

【活动】呢,依然送5本。这次咱改个规则。评论被点赞最多的前五位小伙伴将获得赠书,获奖者可从7本书中任选一本。大家可以自由施展了,你懂得...截止28日10:00。

PS:《机器学习》是新书,刚刚上市,英文版评价非常棒,【阅读原文】放上了京东的购买链接。

当然,大数据的图书都跟机器学习相关,而我们大数据的图书相当多,如果大家想了解,可以返回订阅号界面回复“大数据”。

入门1:全面经典

Machine Learning: The Art and Science of Algorithms that Make Sense of Data

作者:Peter Flach

译者:段菲

页数:312

  • 被誉为内容最全面的机器学习指南,_Machine Learning_期刊总编Peter Flach力作

  • 数百个精选实例和解说性插图,汇集所有用于理解、挖掘和分析数据的先进方法

本书是迄今市面上内容最为全面的机器学习教材之一,书中汇集了所有用于理解、挖掘和分析数据的先进方法,并且通过数百个精选实例和解说性插图,直观而准确地阐释了这些方法背后的原理,内容涵盖了机器学习的构成要素和机器学习任务、逻辑模型、几何模型、统计模型,以及矩阵分解、ROC分析等时下热点话题。

入门2:最易上手

イラストで学ぶ 機械学習

作者:杉山将 

译者:许永伟

页数:240

  • 最简单的机器学习入门书,187张图轻松入门

  • 覆盖机器学习中最经典、用途最广的算法

  • 提供可执行的Matlab程序代码

本书用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的概况;第Ⅱ部分和第Ⅲ部分分别介绍了各种有监督的回归算法和分类算法;第Ⅳ部分介绍了各种无监督学习算法;第Ⅴ部分介绍了机器学习领域中的新兴算法。书中大部分算法都有相应的MATLAB程序源代码,可以用来进行简单的测试。

实战1:最受欢迎

Machine Learning in Action

作者:Peter Harrington

译者:李锐 李鹏 曲亚东 王斌

页数:332

  • 最畅销机器学习图书

  • 介绍并实现机器学习的主流算法

  • 面向日常任务的高效实战内容

全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

实战2:必应团队教你ML系统设计

Building Machine Learning Systems with Python

作者:Willi Richert,Luis Pedro Coelho

译者:刘峰

页数:224

  • 微软Bing核心团队成员推出

  • 聚焦算法编写和编程方式

  • 结合大量实例学会解决实际问题

本书将向读者展示如何从原始数据中发现模式,首先从Python与机器学习的关系讲起,再介绍一些库,然后就开始基于数据集进行比较正式的项目开发了,涉及建模、推荐及改进,以及声音与图像处理。通过流行的开源库,我们可以掌握如何高效处理文本、图片和声音。同时,读者也能掌握如何评估、比较和选择适用的机器学习技术。

实战3:Spark + ML

Machine Learning with Spark

作者:Nick Pentreath

译者:蔡立宇 黄章帅 周济民

页数:240

  • 当机器学习遇上最流行的并行计算框架Spark

  • 以机器学习算法为主线,结合实例探讨Spark的实际应用

本书介绍Spark的基础知识,从利用Spark API来载入和处理数据,到将数据作为多种机器学习模型的输入。此外还通过详细的例子和现实应用讲解了常见的机器学习模型,包括推荐系统、分类、回归、聚类和降维。最后还介绍了一些高阶内容,如大规模文本数据的处理,以及Spark Streaming下的在线机器学习和模型评估方法。

实战4:Mahout ML

Mahout in Action

作者:Sean Owen,Robin Anil等

译者:王斌 韩冀中 万吉

页数:340

  • Apache基金会官方推荐

  • Mahout核心团队权威力作

  • 大数据时代机器学习的实战经典

Mahout作为Apache的开源机器学习项目,把推荐系统、分类和聚类等领域的核心算法浓缩到了可扩展的现成的库中。使用Mahout可以在自己的项目中应用亚马逊、Netflix等公司的机器学习技术。

实战5:Test-Driven实践

Thoughtful Machine Learning: A Test-Driven Approach

作者:Matthew Kirk

译者:段菲

页数:204

  • 用测试驱动方法开发出可靠、稳定的机器学习算法

  • 利用机器学习技术解决涉及数据的现实问题

通过阅读本书,你将能够:

  • 在编写代码之前,运用测试驱动的方法来编写和运行测试

  • 学习八种机器学习算法的最佳用法,并进行权衡

  • 通过动手实践真实示例,对每种算法进行测试

  • 理解测试驱动开发和对解进行验证的科学方法之间的相似性

  • 获悉机器学习的风险,如对数据产生欠拟合或过拟合

  • 探索可改善机器学习模型或数据提取的各种技术

本书每一章都通过示例介绍了机器学习技术能够解决的有关数据的具体问题,以及求解问题和处理数据的方法。具体涵盖了测试驱动的机器学习、机器学习概述、K 近邻分类、朴素贝叶斯分类、隐马尔可夫模型、支持向量机、神经网络、聚类、核岭回归、模型改进与数据提取等内容。

****— 【 THE END 】—

本公众号全部博文已整理成一个目录,请在公众号里回复「m」获取!

3T技术资源大放送!包括但不限于:Java、C/C++,Linux,Python,大数据,人工智能等等。在公众号内回复「1024」,即可免费获取!!

posted @ 2021-03-27 12:01  程序员黄小斜  阅读(503)  评论(0编辑  收藏  举报