大数据时代趋势下的你,对大数据的了解有多少

大数据时代趋势下的你,对大数据的了解有多少

大数据-特征定义

“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”这句话是麦肯锡提出的表示大数据时代的到来,是最早提出这一理论的人.

大数据时代趋势下的你,对大数据的了解有多少

在业界最早是由IBM所提出的定义,它将大数据的特征归纳为4个“V”,也就是量Volume、多样Variety、价值Value、速Velocity,也可以将其理解为四个层面:

一、量Volume:数据体量巨大。简单来讲就是大数据的起始计量单位至少也得是P(1000个T)开头,个别的甚至达到Z(10亿个T);

二、多样Variety:数据类型繁多。比如,图片、地理位置、视频、网络日志信息等等。

三、价值Value:价值密度低,商业价值高。

四、速Velocity:处理速度快。这一点也是和传统的数据挖掘技术有着本质的不同。

当然这些V并不能真正说清楚大数据的所有特征。

"三分技术,七分数据,得数据者得天下。"这句话是维克托·迈尔-舍恩伯格在《大数据时代》里所提到的.

这句话的正确性已经不用去论证了。《大数据时代》一书中举了百般例证,都是为了说明一个道理:在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值。书中,作者提及最多的是Google如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;Farecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适。

那么,什么是大数据思维?维克托·迈尔-舍恩伯格认为有三点:

一、需要全部数据样本而不是抽样;

二、关注效率而不是精确度;

三、关注相关性而不是因果关系。

有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。

posted @ 2018-03-13 13:04  刘小子  阅读(241)  评论(0编辑  收藏  举报