大数据的概念和基本技术的通俗的解释

大数据,很明显从字面上理解就是大量的数据,海量的数据。大,意思就是数据的量级很大,不上TB都不好意思说是大数据。数据,狭义上理解就是12345那么些数据,毕竟计算机底层是二进制来存的,那么在大数据领域,数据就不仅仅包括数字这些,它可以是所有格式的东西,比如日志,音频视频,文件等等。

所以,大数据从字面上理解就是海量的数据,技术上它包括这些海量数据的采集,过滤,清洗,存储,处理,查看等等部分,每一个部分包括一些大数据的相关技术框架来支持。

当然了,关于这些只是大数据的边角料,数据资料是一直在更新完善的,大数据资料库是收集资料、传输资料、存储资料之后再挖掘资料、分析资料、展示资料,这一系列的步骤都是非常关键的,也是密不可分的。

都是需要有着庞大的数据来源,不仅如此,大数据和云计算也是有着非常密切的关系的,比如,大数据的分布式存储以及分布式计算都是云计算的重要技术。

大数据具有4大特征,也就是快速化、多样化、大量化以及价值高和密度低,快速化是指的互联网连接设备数量的增长为我们带来更高速数据的处理。

而多样化则是指的数据的来源多,格式也多,来源具体到生活中包括搜索引擎的信息来源、社交网络信息来源、通话记录等都是大数据信息的来源。

当然了,关于这些只是大数据的边角料,数据资料是一直在更新完善的,大数据资料库是收集资料、传输资料、存储资料之后再挖掘资料、分析资料、展示资料,这一系列的步骤都是非常关键的,也是密不可分的。

都是需要有着庞大的数据来源,不仅如此,大数据和云计算也是有着非常密切的关系的,比如,大数据的分布式存储以及分布式计算都是云计算的重要技术。

大数据具有4大特征,也就是快速化、多样化、大量化以及价值高和密度低,快速化是指的互联网连接设备数量的增长为我们带来更高速数据的处理。

而多样化则是指的数据的来源多,格式也多,来源具体到生活中包括搜索引擎的信息来源、社交网络信息来源、通话记录等都是大数据信息的来源。

大数据分析目前存在以下三个问题

数据存储问题:随着技术不断发展,数据量从TB上升至PB,EB量级,如果还用传统的数据存储方式,必将给大数据分析造成诸多不便,这就需要借助数据的动态处理技术,即随着数据的规律性变更和显示需求,对数据进行非定期的处理。同时,数量极大的数据不能直接使用传统的结构化数据库进行存储,人们需要探索一种适合大数据的数据储存模式,也是当下应该着力解决的一大难题。

分析资源调度问题:大数据产生的时间点,数据量都是很难计算的,这就是大数据的一大特点,不确定性。所以我们需要确立一种动态响应机制,对有限的计算、存储资源进行合理的配置及调度。另外,如何以最小的成本获得最理想的分析结果也是一个需要考虑的问题。

专业的分析工具:在发展数据分析技术的同时,传统的软件工具不再适用。目前人类科技尚不成熟,距离开发出能够满足大数据分析需求的通用软件还有一定距离。 如若不能对这些问题做出处理,在不久的将来大数据的发展就会进入瓶颈,甚至有可能出现一段时间的滞留期,难以持续起到促进经济发展的作用。



 


 
好文要顶 关注我 收藏该文  
posted @ 2019-09-17 23:34  龙帅二号  阅读(1923)  评论(0编辑  收藏  举报