摘要:
数据同步,顾名思义就是不同系统的数据进行同步处理。而业务系统所涉及的数据库同步是重中之重,虽然大部分数据库都提供了导入导出的工具,但是数据存储到各个地方,Hive、Hbase、MySQL、Oracle 等各种各样的不同数据库,然而要把数据同步到指定不同类型的存储库是非常麻烦。那该如何统一实现数据源同 阅读全文
摘要:
迄今,相信大家肯定听说过 HBase,但是对于 HBase 的了解可能仅仅是它是 Hadoop 生态圈重要的一员,是一个大数据相关的数据库技术。 今天我带你们一起领略一下 HBase 体系架构,看看它是如何大规模处理海量数据。 一、什么是 HBase? 关于 HBase 的实现,是基本遵循 Bigt 阅读全文
摘要:
如果你关注大数据科技动向,你对 NoSQL 一定不陌生,NoSQL 是一个分布式数据库。在过去时间,数据存储一直关系型数据库天下,有着良好的控制并发操作、事务功能。虽然RDBMS很优秀,但是随着时间的推移就出现了两个关系数据库解决不了的问题:快速增长的数据规模和日渐复杂的数据模型。结果,我们看到了 阅读全文
摘要:
一、什么是 Apache Hive? Apache Hive 是一个基于 Hadoop Haused 构建的开源数据仓库系统,我们使用它来查询和分析存储在 Hadoop 文件中的大型数据集。此外,通过使用 Hive,我们可以在 Hadoop 中处理结构化和半结构化数据。 换句话说,Hive 是一个数 阅读全文
摘要:
SQL语言相信大家都不陌生,从本质上来说,它是一种结构化查询语言,是用来数据库之间的通信的编程语言。 作为一名Java程序员,我们从Java角度来看,SQL语言相当于Java接口,而数据库是实现这个接口的实现类,SQL语句则是实现类的方法!!。 从这里我们就可以理解了,每个数据库都有着自己独特的规则 阅读全文
摘要:
什么是元数据?在前面的什么是元数据文章中,我们也提到过,元数据是数据的数据,可以帮助数据平台解决“有哪些数据”、“数据存储有多少”、“数据流中的血缘关系”、“如何找到我需要的数据”、“如何使用数据”和“数据的生产进度”问题。 元数据管理是做什么? 元数据在数据平台对原信息的收集、汇总和传递将数据平台 阅读全文
摘要:
什么是元数据? 要理解这个问题,首先要知道“元”是什么。 元数据意味着“有关数据的数据”。虽然“meta”前缀(来自希腊语介词和前缀 μετά-)意味着“之后”或“超越”,但它用于在认识论中表示“约”。元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或其结构(长度、字段、数据列),或其相 阅读全文