Data Mining Tutorial -- 简明译文Part 01

 

概述

数据挖掘被定义为从大量数据集中提取信息的过程。换句话说,我们可以说数据挖掘是从数据中挖掘知识。本教程从基本概述和数据挖掘中涉及的术语开始,然后逐步介绍知识发现,查询语言,分类和预测,决策树归纳,聚类分析以及如何挖掘Web等主题。

 

读者

本教程是为计算机科学毕业生准备的,旨在帮助他们理解与数据挖掘相关的基本到高级概念。

 

前提

在继续学习本教程之前,您应该了解基本的数据库概念,例如模式,ER模型,结构化查询语言和数据仓库概念的基本知识。

 

第一章  Overview

信息产业中有大量数据可用。在将数据转换为有用信息之前,此数据无用。有必要分析这些大量数据并从中提取有用信息。

提取信息不是我们需要执行的唯一过程;数据挖掘还涉及其他过程,如数据清理,数据集成,数据转换,数据挖掘,模式评估和数据表示。一旦所有这些过程结束,我们就可以在欺诈检测,市场分析,生产控制,科学探索等许多应用中使用这些信息。

 

什么是数据挖掘?

 

数据挖掘被定义为从大量数据集中提取信息。换句话说,我们可以说数据挖掘是从数据中挖掘知识的过程。提取的信息或知识可用于以下任何应用程序:

  • 市场分析
  • 欺诈识别
  • 客户保有
  • 产品控制
  • 科学探索

 

数据挖掘应用


数据挖掘在以下领域非常有用:

  • 市场分析与管理
  • 公司分析&风险管理
  • 欺诈识别

除此之外,数据挖掘还可用于生产控制,客户保有,科学探索,体育,占卜和网络冲浪辅助等领域。

 

市场分析与管理


下面列出了使用数据挖掘的各个市场领域:

  • 客户分析 - 数据挖掘有助于确定哪类人购买何种产品。
  • 确定客户需求 - 数据挖掘有助于为不同客户确定最佳产品。它使用预测来找出可能吸引新客户的因素。
  • 跨市场分析 - 数据挖掘执行产品销售之间的关联/关联。
  • 目标营销 - 数据挖掘有助于找到具有相同特征的模型客户群,例如兴趣,消费习惯,收入等。
  • 确定客户购买模式 - 数据挖掘有助于确定客户购买模式。
  • 提供摘要信息 - 数据挖掘为我们提供了各种多维摘要报告。

 

企业分析与风险管理

 

数据挖掘用于公司部门的以下领域:

  • 财务规划和资产评估 - 它涉及现金流量分析和预测,用于评估资产的或有索赔分析。
  • 资源规划 - 包括总结和比较资源和支出。
  • 竞争 - 它涉及监控竞争对手和市场方向。

 

欺诈识别


数据挖掘还用于信用卡服务和电信领域以检测欺诈。在欺诈电话中,它有助于找到呼叫的目的地,呼叫的持续时间,一天或一周的时间等。它还分析偏离预期规范的模式。

posted @ 2018-10-20 09:18  q4zs  阅读(232)  评论(0)    收藏  举报