数据的昨天,今天和明天---关于BI的一些杂想
引本山大叔一段小品台词:
小崔:这回咱们改改规矩,大叔您先说.
黑土:昨天,数据四千万,今天数据来了,明天,数据五千万,谢谢.
小崔:大叔,我说的不是昨天.
黑土:那是说哪天?
小崔:不是哪天,我的意思就是咱们一起评说一下数据的过去,分析一下数据的现状,再展望一下数据的未来.
黑土:啊~~~那叫数据的过去,现在和将来……
一次在QQ群里和朋友讨论什么是BI,当时头脑里不知道哪里来的概念,遂用如下两点来概括这一概念:一是和中文谐音的”悲哀”,再就是像本山大叔的小品一样,数据的过去,现在和将来.
首先,BI是干什么的,不妨看看BI折腾的是什么,BI折腾的是什么,没错,就是数据.不过,正所谓巧妇难为无米之崔,再好的方法论也无法从一个空的数据中折腾出什么.
所以,说其悲哀,主要是商业智能在国内起步晚,发展慢,这个对于国内微软技术社区搞BI的朋友来说是被公认的原因之一,另外SQLServer早先版本对于商业智能和数据仓库的缺陷,也是另外一个主要的原因.早先在学校里做项目外包的那段时间,当最后的成品拿到总公司让专家评审的时候,他们觉得很奇怪,说怎么能用SQLServer呢?后来当他们知道这个项目一共才20来万的时候,才没有继续追问下去.同样意思也是说,如果这是一个百万级别的项目的话,那可就说不过去了.(注:时间:2005年上半年)
是歧视吗?确实.在那个年头别说是.net刚1.x,在还没有.net的时候呢?不过,我们在近几年看到了微软在这方面的努力,并且对逐个模块进行了加强,增进了各产品之间的兼容程度,微软在这一方面也正在逐渐的扩大着市场.
以上”忆苦思甜”中.
回到数据的话题,这里所提到的数据,通常指那种一条一条的,能从某种程度上代表一条信息的的东西.如果说语言的诞生方便了人类信息的传递,那么从文字的发明(包括被发现刻在石壁上的画)到后来纸张的发明,方便了人类对于信息的记录,这绝对是人类对于信息的理解的一大进步,这样诗人才能把自己的感情抒发出来流芳百世,音乐家和歌手才能把自己要表达的旋律动荡起来.不过对于有些信息到后来让人们就感觉到心有余而力不足,就像要统计人口信息这样的数据,往往要花费很多的时间和精力,因为这里面还涉及到太多的分类等问题,像常住人口,暂住人口(北京,多吧),出生人口,以及对人的年龄特征进行分段统计等,对于手工纸张的操作接近于灾难.那么到后来的电子设备的出现,方便了人们对于信息的记录,查询和统计等管理,人们可以马上获得自己想要的统计信息.不过,人们远远不会满足对于过去信息的统计,慢慢的人们发现了过去与将来的联系,所以就诞生了一批研究历史的人,同样,也衍生出了商业智能里最高的层次,数据挖掘,从而帮助人们发现数据未来可能会怎么样.
以上是”数据”的故事.
数据的昨天告诉我们发生了什么,数据的今天协助我们了解为什么会这样,数据的明天告诉我们将来可能会发生什么,辅助决策者调整相应的策略.商业智能就是这样的一个过程.而数据挖掘也是人类思维的一种逻辑抽象,就像我们都知道学习好,不淘气,听长辈话的孩子会受到周围人的喜欢,所以聪明的小孩子都自然的会像学习好,不淘气,听长辈的话这个方向努力,因为即使小孩子也会观察周围什么样的小朋友会最受长辈们的宠爱从而从中获得更多的表扬.
商业智能已经在国外出现了很多成功案例,而国内很多企业目前都把数据停留在”昨天”,当然,前提是这些数据已经是海量的级别,因为假如单纯的给你一个中学生的课程表的话,对于这样的数据,”今天”已经没有什么意义,更不用提一个课程表的”明天”,不过如果配合其它方面的数据,比如学生档案,学生成绩等信息,那么这个针对这种特定场合的信息就发挥作用了,比如校长最后分析出这个班的教学成果差的原因是由于课表安排的不合理.所以,商业智能一直强调海量的数据,这就是原因.不过能把数据从”昨天”归弄到”今天”或者”明天”,我个人认为还需要我们付出很大的努力,当然还有数据拥有者本身对于自己领域数据的理解.
国内已经出现了为数不多的BI的成功案例,我们可以看到社会的发展给人类文明带来的进步,更看到了科技带给人们的力量.但是对于残酷激烈的竞争,全方位的理解自己的数据,将会使自己获得更多的竞争砝码.
好比就像安慰失落中的人我们通常会说:人不能总活在自己的过去,要坚强起来,勇敢的面对自己的将来.另外古语也说:知己知彼,百战不殆.这样激烈的竞争,连自己都不是很了解了,又怎么能战胜对方呢?
---------------------------------------------------------------
aspnetx的BI笔记系列索引:
使用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能
---------------------------------------------------------------