数据挖掘与机器学习之间有什么联系?
谈到对数据进行分析利用,很多人会想到“数据挖掘”(data mining),这里简单探讨一下数据挖掘和机器学习的联系。
数据挖掘领域是在二十世纪九十年代左右形成,他收到很多学科的影响,其中数据库、机器学习、统计学无疑是影响最大的。数据挖掘是从海量数据中发掘知识,这就必然涉及到对“海量数据”的管理和分析。大体来说,数据库领域的研究为数据挖掘提供了数据管理技术,而机器学习和统计学的研究为数据挖掘提供了数据分析技术。
由于统计学届的研究成果通常需要机器学习研究来形成有效的学习算法,之后再进入数据挖掘领域,因此从这个意义上来说,统计学主要是通过机器学习对数据挖掘发挥影响,而机器学习领域和数据库领域则是数据挖掘的两大技术支撑。