摘要:
数据湖的定义 数据湖的参考架构 数据湖最核心的能力包括: 数据集成能力(数据接入) 数据存储 数据搜索 数据治理 数据质量 安全管控 自助数据发现 数据湖与数据仓库的区别 数据湖的优势 阅读全文
摘要:
定义 看下维基百科的定义:数据湖是一个以原始格式(通常是对象块或文件)存储数据的系统或存储库。数据湖通常是所有企业数据的单一存储。用于报告、可视化、高级分析和机器学习等任务。数据湖可以包括来自关系数据库的结构化数据(行和列)、半结构化数据(CSV、日志、XML、JSON)、非结构化数据(电子邮件、文 阅读全文
摘要:
单线程 /* 什么是单线程: 单线程在程序执行时,所走的程序路径按照连续顺序排下来,前面的必须处理好,后面的才会执行 单线程处理的优点: 同步应用程序的开发比较容易,但由于需要在上一个任务完成后才能开始新的任务,所以其效率通常比多线程应用程序低。 */ public class Demo { pub 阅读全文