数据挖掘之七种经常使用的方法
利用数据挖掘进行数据分析经常使用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等。 它们分别从不同的角度对数据进行挖掘。
① 分类。分类是找出数据库中一组数据对象的共同特点并依照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。
它能够应用到客户的分类、客户的属性和特征分析、客户惬意度分析、客户的购买趋势预測等。如一个汽车零售商将客户依照对汽车的喜好划分成不同的类,这样营销人员就能够将新型汽车的广告手冊直接邮寄到有这样的喜好的客户手中,从而大大添加了商业机会。
② 回归分析。回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预測变量的函数。发现变量或属性间的依赖关系。其主要研究问题包含数据序列的趋势特征、数据序列的预測以及数据间的相关关系等。
它能够应用到市场营销的各个方面,如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预測及有针对性的促销活动等。
③ 聚类。
聚类分析是把一组数据依照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。
它能够应用到客户群体的分类、客户背景分析、客户购买趋势预測、市场的细分等。
④ 关联规则。关联规则是描写叙述数据库中数据项之间所存在的关系的规则。即依据一个事务中某些项的出现可导出还有一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。
在客户关系管理中。通过对企业的客户数据库里的大量数据进行挖掘,能够从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群。客户寻求、细分与保持。市场营销与推销。营销风险评估和诈骗预測等决策支持提供參考根据。
⑤ 特征。
特征分析是从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的整体特征。如营销人员通过对客户流失因素的特征提取,能够得到导致客户流失的一系列原因和主要特征,利用这些特征能够有效地预防客户的流失。
⑥ 变化和偏差分析。偏差包含非常大一类潜在有趣的知识。如分类中的反常实例,模式的例外,观察结果对期望的偏差等,其目的是寻找观察结果与參照量之间有意义的区别。
在企业危机管理及其预警中。管理者更感兴趣的是那些意外规则。
意外规则的挖掘能够应用到各种异常信息的发现、分析、识别、评价和预警等方面。
⑦ Web页挖掘。
随着Internet的迅速发展及Web 的全球普及。 使得Web上的信息量无比丰富。通过对Web的挖掘,能够利用Web 的海量数据进行分析,收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息,集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息。并依据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆,对这些信息进行分析和处理,以便识别、分析、评价和管理危机。
数据挖掘是一种决策支持过程,它通过高度自己主动化地分析企业的数据,做出归纳性的推理。从中挖掘出潜在的模式。帮助决策者调整市场策略,降低风险,做出正确的决策。
这对于一个企业的发展十分重要。