近两周用业余时间读了《大数据时代》这本书,是听培训时杜威老师推荐的,我快速阅读了一遍,觉得受到了一些启发,发现了一些原来没有想到看到的事情。
首先是大数据代表着数据的样本=全体,这是一个与传统统计学的显著区别。大数据有能力获得全体数据并对其进行分析。
第二就是相关性与因果性同样重要。相关性说明了什么事情与什么什么事情有关系,如商场周围车流量的增多与商场销售额的相关性,因果性说明什么是什么的原因,如睡10个小时是有精神的原因。在大数据中,相关性要比因果性容易获得,而且相关性已经能为客户带来较大的收益。
第三就是大数据允许存在不精确性、混杂性,由于数据量巨大,存在少量的异变不会对结果产生任何影响,如收益是1个亿与1亿零1元的差别可能决策者不关心。
第四是大数据中的三个主要因素,思维、数据、技术,思维觉得你在哪些地方使用大数据。在这三个因素之中,会产生数据中间商,来处理加工数据并出售。