数据挖掘与R语言
数据挖掘正在改变着企业和其他大型组织与客户的互动方式,同时也改变着它们管理复杂过程的方式。大量的数据正在很好地用于预测客户行为和结果。在软件方面,R以其强大的功能和诱人的价格(免费)正在改变着定量分析的“生态系统”。
《数据挖掘与R语言》一书的目的是引领读者迅速地进入这两个世界。本书以实际案例的方式介绍数据挖掘和R软件,这样读者就可以在真实情境中进行学习,而不会迷失在统计理论的细节讨论或者计算机科学的基础概念中。本书中用到的工具全部是免费的:MySQL数据库(用于数据库操作)和R软件(用于分析)。因此,本书教给你的是如何动手的知识。通过学习本书,你将体验到数据挖掘和R的强大功能。如果你能安装这些工具,并通过应用这些工具来详细地学习书中的案例研究,你将收获颇丰。本书逐步地通过案例研究来介绍R的概念,如果你还不熟悉R或者MySQL,你可以按章节顺序来学习这些案例。
“如果你想学习如何用一款统计专家和数据挖掘专家所开发的免费软件包,那就选这本书吧。本书包括大量实际案例,它们充分体现了R软件的广度和深度。”
—— Bernhard Pfahringer, 新西兰怀卡托大学
数据挖掘与R语言(书中大量实际案例充分体现了R软件的广度和深度)
丛书名:计算机科学丛书
书号:978-7-111-40700-3
作者:(葡)Luis Torgo
译者:李洪成陈道轮吴立明译
开本:16开
出版时间:2013.4
定价:49.00元
出版社:机械工业出版社
图书特色
- 通过仔细选择的案例涵盖了主要的数据挖掘技术。
- 给出的代码和方法可以方便地复制或者改编后应用于自己的问题。
- 不要求读者具有R、数据挖掘或统计技术的基础知识。
- 包含R和MySQL基础知识的简介。
- 提供了对数据挖掘技术的特性、缺点和分析目标的基本理解。
《数据挖掘与R语言》是2011年查普曼和霍尔公 司(Chapman& Hall/CRC)出版的《Data Mining with R:Learning withCase Studies》 一书的中文版。英文版从出版后就在亚马逊美国网站上得到了极高的评价,是2011年亚马逊网站上数据挖掘类书籍销量最好的一本。机械工业出版社以极快的速 度引进这本书的中文版,使国内读者在原版出版一年左右的时间里读到本书,不得不赞扬他们独到的眼光。本书翻译完稿的时候(2012年10月),其英文版的 销量还是排在专业书籍的前列,原作者为本书维护了一个网站,读者可以访问该网站查看这些信息。
本书的作者Luís Torgo是一位数据挖掘专家,同时也是一位R开发者。本书给出了四个数据挖掘的实际案例,它们分别是藻类频率的预测、证券趋势预测和交易系统仿真、交易欺诈预测,以及微阵列数据分类。这四个案例基本覆盖了常见的数据挖掘技术,从无监督的数据挖掘技术、有监督的数据挖掘技术到半监督的数据挖掘技术。同时这四个案例从数据量、分析目标和数据类型方面引出了各种各样的挑战性问题,本书给出了克服这些挑战的方法和技巧。阅读本书不需要具备R和数据挖掘的基础知识。为了便于读者阅读,本书第1章给出了R软件的基础知识(安装、R数据结构、R编程、R的输入和输出等)。全书以实际问题、解决方案和对解决方案的讨论为主线来组织内容。读者既可以把本书作为学习如何应用R的一本优秀教材,也可以作为数据挖掘的工具书。读者可以根据自己的需要参考书中的某些具体方法,找到自己实际问题的解决方案。
R 本身是一款十分优秀的统计分析和数据挖掘软件,有关R的书籍和文档也是相当多的。但是系统地讲解用R进行数据挖掘的书籍目前还没有。本书以四个案例研究的形式组织内容,脉络清晰,并且各章自成体系。读者可以从头逐章学习,也可以根据自己的需要进行学习。不管是R初学者,还是熟练的R用户都能从书中找到对自 己有用的内容。
本书有一个免费的R代码集,可以从本书网站下载。其中含有案例研究中的所有代码,这可以帮助你的实践学习。我们强烈建议读者在阅读本书时安装R并实验书中的代码。而且,我们创建了一个名为DMwR的R添加包,它包含本书用到的多个函数和以R格式保存的案例数据集。你应该按照本书的指示,安装并加载该添加包(第1章给出了细节)。