课程一:浅谈数据分析与挖掘

  今年随着业务的需要,对于数据的要求不仅仅是存储和管理,更重要的是需要对大量数据进行分析、加工最后再决策,有鉴于此报了一门课程《SAS数据分析与挖掘》,现将学习过程中的一些心得体会记录在此,以鞭策和激励自己。

 

上图是一个典型的数据六层的模型,按照数据的形态依次可分为:

数据源----数据仓库/数据集市----数据分析----数据挖掘----数据展示----决策

  其中传统公司的DBA可能涉及的层次是最下面的2层,即 数据源(Oracle、SqlServer、MySql)和数据仓库/数据集市,至于上面的数据分析、数据挖掘这些,大多数的数据库人员都接触不到,因为这些已经涉及到业务的层面了,此次的SAS主要涉及数据分析----数据挖掘----数据展示 这3层。

  目前流行的BI(商业智能)实际上就是 数据仓库+数据分析+数据挖掘+数据展示(报表),也就是说会用SAS的DBA就可以去应聘BI的工作了:),开个玩笑,BI最核心的是对业务的理解融汇到数据中去。

  这里谈一下数据分析与数据挖掘的区别:

  数据分析顾名思义,按照给定的公式或规则从已知的数据源里找出自己想要的数据,用于精确定位,同时需求人员很明确自己想要什么和去哪里找。

  数据挖掘从名字上来看就是从一些你所不太清楚的数据中来挖掘一些有用的信息,这个时候你是不知道你到底可以从给定的数据源中获取哪些信息的,只能依据经验去判断。

  数据分析与数据挖掘的区别可以打一个比方,数据分析好比你去超市买东西,你已经知道你要买的东西一定在超市里面,且价格大致上是多少心里已经有数了,要做的只是“去某某超市+付钱买东西”。数据挖掘则好比你去二手市场去淘宝,你在没有去之前是不知道二手市场里面有哪些东西,也不知道你能买到哪些是你需要的,所以你需要去了之后仔细的逛一圈再选择买或不买,这个时候你的目标是不明确的,需要先“挖掘”一番:)。

  SAS作为数据分析领域中的绝对巨无霸,已经发展了30多年了,比关系数据库的历史还要早,所以SAS的很多语法可能DBA会觉得很眼熟,反正我学的时候是有这种感觉的。SAS全名 Statistical Analysis Software,目前SAS公司也是世界上最大的私有化软件企业,其在统计行业的地位就如同Oracle在数据库的地位以及思科在通讯行业的地位一样,绝对的巨无霸和垄断。

  SAS最核心和最权威的即它这么多年来所积累的一些分析算法,这些是得到了国际上的认可的,在国外用SAS分析所得出的报告才会被业界,特别是金融界认可,所以学好SAS还是很有必要的。

  关于SAS的认证如下,作为以后可选择的目标吧:

● SAS程序员
● SAS业务分析师
● SAS数据挖掘
● SAS系统开发专家
● SAS系统管理专家


●sas程序员(基础高级
技能:SAS基础,编程开发
主要职责描述:读取和管理数据,以及进行复杂的查询和分析

●SAS数据挖掘专家 ( 统计分析、预报分析、数据挖掘建模 )
⊿ SAS数据挖掘专家 之 统计分析(基础高级)技能:统计分析(主要职责描述:为统计分析清洗和准备数据,同时建立和解释从简单到复杂的统计数据分析
⊿ SAS数据挖掘专家 之 预报分析(基础高级)技能:预报分析主要职责描述:开发预测模型来使企业更好地进行信息决策
⊿ SAS数据挖掘专家 之 数据挖掘建模(基础高级)技能:数据挖掘建模主要职责描述:从大数据库中提取数据来建立数据分割和预测模型
  

●sas SAS业务分析师(基础高级)
技能:业务分析
主要职责描述:读取已有的信息,并通过图形界面创建我自己的报表和进行相应的分析
●SAS系统开发专家 ( 数据整合、报表开发、多维分析 )
⊿ SAS系统开发专家 之 数据整合((基础高级))技能:数据整合(主要职责描述:为报表和分析而收集、存储、清洗数据
⊿ SAS系统开发专家 之 报表开发(基础高级)技能:报表开发主要职责描述:进行查询和创建报表
⊿ SAS数据挖掘专家 之 预测预报(基础高级)技能:数据挖掘建模主要职责描述:从大数据库中提取数据来建立数据分割和预测模型

●SAS系统管理专家 (SAS EG管理、SAS平台管理 )
⊿ SAS EG管理(基础高级)技能:SAS EG管理主要职责描述:安装、配置、管理和维护SAS Enterprise Guide
⊿ SAS平台管理(基础高级)技能:SAS 平台管理主要职责描述:安装、配置、管理和维护SAS平台

 

posted @ 2013-02-21 11:12  Chris-Hu  阅读(435)  评论(0编辑  收藏  举报