摘要: 原网址:https://blog.csdn.net/liyaohhh/article/details/50697519 hive在实际的应用过程中,大部份分情况都会涉及到不同的表格的连接, 例如在进行两个table的join的时候,利用MR的思想会消耗大量的内存,磁盘的IO,大幅度的影响性能,因为s 阅读全文
posted @ 2019-03-26 21:46 lxgjob 阅读(2662) 评论(0) 推荐(0) 编辑
摘要: 原网址:https://ci.apache.org/projects/flink/flink-docs-release-1.7/dev/connectors/ Predefined Sources and Sinks A few basic data sources and sinks are bu 阅读全文
posted @ 2019-03-25 22:47 lxgjob 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 介绍 Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。应用只需要连接Alluxio即可访问存储在底层任意存储系统中的数据。此外,Alluxio的以内存为中心的架构使得数据的访问速度能比现有常规方 阅读全文
posted @ 2019-03-15 11:38 lxgjob 阅读(390) 评论(0) 推荐(0) 编辑