大数据生态体系分为数据来源层,数据传输层,数据存储层,资源管理层,数据计算层和任务调度层,其中结构化数据库为我们熟悉的
数据库,文件日志这种半结构化的文本也囊括在内,甚至视频和ppt这种非结构化数据也是在处理范围的,kafka在所有存储工具中最为
强大,三种数据都可以处理并且拥有储存功能