导航
统计
- 随笔 - 105
- 文章 - 0
- 评论 - 53
- 阅读 - 39万
随笔分类 - Spark Streaming
-
实时计算平台中的弹性集群资源管理
摘要:本文系微博运维数据平台(DIP)在实时计算平台的研发过程中集群资源管理方面的一些经验总结和运用,主要关注以下几个问题: 异构资源如何整合? 实时计算应用之间的物理资源如何隔离? 集群资源利用率如何提高? 集群运维成本如何降低? 1. 背景 这是我们初期的一个实时计算架构,大致划分为三个部分: (1) 阅读全文
-
Spark Streaming fileStream实现原理
摘要:fileStream是Spark Streaming Basic Source的一种,用于“近实时”地分析HDFS(或者与HDFS API兼容的文件系统)指定目录(假设:dataDirectory)中新近写入的文件,dataDirectory中的文件需要满足以下约束条件:(1)这些文件格式必须相同,... 阅读全文
搜索
随笔分类
- AnalysisQL(3)
- Beeline(1)
- Camus(1)
- Design Patterns(1)
- Docker(1)
- Element+(1)
- FairScheduler(1)
- Flume(1)
- Git(2)
- Go(1)
- Hadoop(18)
- HBase(8)
- Hive(11)
- HiveServer2(4)
- Infrastructure(5)
- Java(12)
- Kafka(3)
- Linux(1)
- MySQL(1)
- Python(11)
- Spark(18)
- Spark SQL(3)
- Spark Streaming(2)
- SpringBoot(2)
- Storm(1)
- Vue3(2)
- Yarn(5)
- 创业(1)
- 大数据(1)
- 技术(3)
- 技术杂谈(4)
- 简言编程(Python)(2)
- 妹子、代码与猫(20)
- 数据仓库(2)
- 团队管理(2)
- 微服务(1)
- 小程序(3)
- 更多
随笔档案
- 2023年2月(1)
- 2023年1月(1)
- 2022年9月(5)
- 2022年6月(1)
- 2022年5月(5)
- 2022年4月(2)
- 2022年3月(6)
- 2022年2月(1)
- 2022年1月(2)
- 2021年12月(7)
- 2021年11月(1)
- 2020年8月(1)
- 2020年7月(1)
- 2020年6月(1)
- 2020年5月(5)
- 2020年2月(3)
- 2019年9月(1)
- 2018年5月(1)
- 2017年5月(1)
- 2016年7月(1)
- 2016年6月(5)
- 2016年5月(1)
- 2016年2月(1)
- 2015年12月(3)
- 2015年11月(7)
- 2015年10月(5)
- 2015年8月(7)
- 2015年7月(2)
- 2015年5月(5)
- 2015年4月(2)
- 2015年3月(1)
- 2015年2月(2)
- 2015年1月(4)
- 2014年12月(5)
- 2014年11月(1)
- 2014年2月(2)
- 2014年1月(5)
- 更多
最新评论
- 1. Re:Hive SQL运行状态监控(HiveSQLMonitor)
- @DATA·CN 大佬,您按照这个方式实现了吗...
- --Angel6688
- 2. Re:若依(RuoYi )权限管理设计
- 数据权限,ruoyi采用的是sql join的形式。感觉不是很好。侵入性很强。 我采用注解判断参数来拦截越权访问。 实现在该项目: 欢迎大佬点评指正。...
- --CoderV的进阶笔记
- 3. Re:若依(RuoYi )权限管理设计
666
- --牛头人363
- 4. Re:微信小程序使用 ECharts
已阅
- --哎呦你可棒棒了
- 5. Re:若依(RuoYi )权限管理设计
收藏了。
- --清风如你