会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lxgjob
博客园
首页
新随笔
联系
订阅
管理
2019年3月26日
hive join的三种优化方式
摘要: 原网址:https://blog.csdn.net/liyaohhh/article/details/50697519 hive在实际的应用过程中,大部份分情况都会涉及到不同的表格的连接, 例如在进行两个table的join的时候,利用MR的思想会消耗大量的内存,磁盘的IO,大幅度的影响性能,因为s
阅读全文
posted @ 2019-03-26 21:46 lxgjob
阅读(2732)
评论(0)
推荐(0)
2019年3月25日
Flink--Streaming Connectors
摘要: 原网址:https://ci.apache.org/projects/flink/flink-docs-release-1.7/dev/connectors/ Predefined Sources and Sinks A few basic data sources and sinks are bu
阅读全文
posted @ 2019-03-25 22:47 lxgjob
阅读(220)
评论(0)
推荐(0)
2019年3月15日
Alluxio学习
摘要: 介绍 Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。应用只需要连接Alluxio即可访问存储在底层任意存储系统中的数据。此外,Alluxio的以内存为中心的架构使得数据的访问速度能比现有常规方
阅读全文
posted @ 2019-03-15 11:38 lxgjob
阅读(413)
评论(0)
推荐(0)
公告