云计算和大数据的崛起
云缓解了不少问题,使许多大小企业的大数据处理成为可能。但要从大量数据中提取商业价值仍然具有其复杂性。
云计算使得大数据更加大众化——任何企业现在都可以处理巨大规模下的非结构化数据。
咋一看,很难看出为什么新大数据世界的非结构化数据方式如此必要。即便是新方式带来新的商业价值,为什么不停留在网络会议?为什么要纠结于云数据库呢?
大数据标记
大数据就像SDN、DevOps和云计算,是崭新而闪耀的新标记。既不容忽视,又很难理解。没有单一的“大数据”类型——它是非结构化数据的集合标记堆栈。
举个例子,大数据分析的原则是从大量数据中提取商业价值。数据专家处理资源,将数据转变成有用的信息。经典RDBMS(关系数据库管理系统)能够处理很多数据,并且已经持续多年。为什么数据专家不能继续在RDBMS专注于结构化数据呢?RDBMS 和NoSQL哪个更好?
结构化或非结构化数据
一个企业选择技术堆栈是由他们需要存储的数据类型所导向的,数据类型则是由业务需求所导向。
RDBMS对于管理结构化、高度关联数据很有帮助。
对于由社会媒体、传感网络和联合分析数据所产生的越来越多的非结构化数据,以及对于持续变化的需要复制到其他操作网站的数据,NoSQL更适合这些情况。非结构化数据在大小上可以是兆字节或甚至千兆字节。
大数据云:新的解决方案
理论上,管理基于云的大数据是符合成本效益的、可伸缩的并且构建迅速的。
数据库管理人员则不那么轻松。NoSQL数据库在近几年出现,凭借它们的键值对,文档存储,看起来并不像关系数据更换缓慢,新的数据很难捕捉、存储、处理、做报告以及归档。
但对于系统管理者来说也不那么坏。如果他们运行一个私有云,硬件和软件的新的非结构化数据技术堆栈看起来就像旧的——IaaS在底部,数据库服务在中间,他们不需要接触到技术堆栈的低层。
将数据管理于Windows Aure Tables、MongoDB、Navicat for MySQL中只是充分利用大数据所需要的数据科学的开始。还有大量的业务合作、再培训和其它态度调整需要顾及。