迈克巴洛谈实时大数据分析学

由迈克•巴洛所写的 实时大数据分析论:新兴设计白皮书覆盖到了大数据分析学主题以及实时大数据分析学(RTBDA)与传统分析学的区别是怎样的。迈克描述了实时大数据分析学框架的5个阶段:数据提取、模型开发、验证部署、实时评分与模型刷新。

他也谈论了大卫•史密斯所提出的RTBDA技术堆的四层:

  • 数据
  • 分析论
  • 集成
  • 决策

InfoQ在与迈克的交流中说到了有关实时大数据分析论当前的状态以及其在大数据空间像决策科学这类的新兴趋势。

InfoQ:您能定义究竟什么是大数据并解释它是如何工作的吗?

Mike:实时大数据代表科技与技能的汇聚。过去需要数月、数日或数小时的分析过程现已缩短至数分、数秒、甚至不到一秒。2年以前,许多数据分析师认为在40分以内生成一个查询结果是不可思议的事情。今天,他们能够在毫秒内即可看到结果。这实际上就是思想的速度——你想到一个查询,就立马得到结果并开始你的试验。另一方面,毫秒似乎看起来像是一个永恒对于高速交易系统,对一个被解析成微秒的世界中运作的系统来说。因此这个术语“实时”在很大程度上取决于你工作或手头任务上的需求。

InfoQ:传统分析学与实时大数据分析学有何不同?

Mike:传统分析学偏向于从一个传统数据仓库中检索结构化数据而生成报告的过程。实时大数据分析学更进了一步,通过产生洞见或推荐用于在销售点上驱动商业价值,不管销售点是实体商店还是电子商务网站。

InfoQ:在您的白皮书中,您谈到了新世纪机器开始像人一样去思考和响应,和数据科学到下一个逻辑边界:决策科学的转换。您能更多地探讨下这些革新及即将到来的趋势吗?

Mike:趋势就是面向更快速、更自动化、更加智能以及更加业务友好的分析学,快速地总结洞见并提供那些更可能产生大销量与高利润的特定的推荐。

InfoQ:您也谈到了分析学的创建与消耗是两个不同的事情。能给出这两个步骤的例子吗?

Mike:数据分析师——与数据直接打交到的人——是不同于数据的使用者或消费者的,后者更趋于接近公司实际的客户。两者都需要可视化工具理解数据,但所使用的工具不同。数据分析师和数据科学家需要工具进行数据建模。用户和消费者,不管是销售代表还是卖主,需要工具来理解数据是如何可能影响顾客行为并产生销量的。

InfoQ:什么是实时大数据分析学的新兴趋势呢?

Mike:因为有许多不同种类的分析师与多种不同类型的用户/消费者,那么一定有一个工具的选择或类别,用于可视化、解释和演绎大数据,以有趣的方式来驱动真正商业价值。目前,没有一个“万全之策”的解决方案来发动一个实时大数据平台。可喜的是,许多非常聪明并高度积极的人们在努力开发技能与策略将大数据转换成有形的企业资产。敬请期待,这应该是令人兴奋的!

 

posted on 2013-06-02 18:25  missyxu  阅读(919)  评论(0编辑  收藏  举报

导航