导航
统计
- 随笔 - 105
- 文章 - 0
- 评论 - 53
- 阅读 - 39万
12 2014 档案
-
MapReduce Shuffle And Sort
摘要:引言MapReduce作出保证:进入每个Reducer的数据行都是有序的(根据数据行的键值进行排序)。MapReduce将Mapper的输出进行排序并传递给Reducer作为输入的过程称为Shuffle。在很多场景下,Shuffle是整个MapReduce过程的核心,也是“奇迹”发生的地方,如下图所... 阅读全文
-
REST服务中的日志可视化(关键技术实现)
摘要:引言在系统构建完成之后,我们通常会使用REST API对外提供服务,在REST API的处理过程中经常会出现一些异想不到的问题(用户权限不足、参数不全、数据库访问异常等),导致请求失败,很多时候用户并不能理解这些失败是如何造成的,他们更多的是直接找到相应的开发者询问:“我的这个接口失败了,没有拿到数... 阅读全文
-
HBase Endpoint
摘要:引言假设HBase某张表有1000个Region,里面存储着100万行数据,现在需要统计满足某些条件的行数,普通的做法是使用Filter(过滤条件),通过HBase API将满足过滤条件的行数据Scan至客户端之后进行汇总,这需要在HBase RegionServer与Client之间传送大量的数据... 阅读全文
-
Bloom Filter(布隆过滤器)
摘要:布隆过滤器用于测试某一元素是否存在于给定的集合中,是一种空间利用率很高的随机数据结构(probabilistic data structure),存在一定的误识别率(false positive),即布隆过滤器报告某一元素存在于某集合中,但是实际上该元素并不在集合中,但是没有错误识别的情形(fals... 阅读全文
-
HBase HFileBlock
摘要:HFileBlock官方源码注释:ReadingHFileversion 1 and 2 blocks, and writing version 2 blocks.In version 1 all blocks are always compressed or uncompressed, as sp... 阅读全文
搜索
随笔分类
- AnalysisQL(3)
- Beeline(1)
- Camus(1)
- Design Patterns(1)
- Docker(1)
- Element+(1)
- FairScheduler(1)
- Flume(1)
- Git(2)
- Go(1)
- Hadoop(18)
- HBase(8)
- Hive(11)
- HiveServer2(4)
- Infrastructure(5)
- Java(12)
- Kafka(3)
- Linux(1)
- MySQL(1)
- Python(11)
- Spark(18)
- Spark SQL(3)
- Spark Streaming(2)
- SpringBoot(2)
- Storm(1)
- Vue3(2)
- Yarn(5)
- 创业(1)
- 大数据(1)
- 技术(3)
- 技术杂谈(4)
- 简言编程(Python)(2)
- 妹子、代码与猫(20)
- 数据仓库(2)
- 团队管理(2)
- 微服务(1)
- 小程序(3)
- 更多
随笔档案
- 2023年2月(1)
- 2023年1月(1)
- 2022年9月(5)
- 2022年6月(1)
- 2022年5月(5)
- 2022年4月(2)
- 2022年3月(6)
- 2022年2月(1)
- 2022年1月(2)
- 2021年12月(7)
- 2021年11月(1)
- 2020年8月(1)
- 2020年7月(1)
- 2020年6月(1)
- 2020年5月(5)
- 2020年2月(3)
- 2019年9月(1)
- 2018年5月(1)
- 2017年5月(1)
- 2016年7月(1)
- 2016年6月(5)
- 2016年5月(1)
- 2016年2月(1)
- 2015年12月(3)
- 2015年11月(7)
- 2015年10月(5)
- 2015年8月(7)
- 2015年7月(2)
- 2015年5月(5)
- 2015年4月(2)
- 2015年3月(1)
- 2015年2月(2)
- 2015年1月(4)
- 2014年12月(5)
- 2014年11月(1)
- 2014年2月(2)
- 2014年1月(5)
- 更多
最新评论
- 1. Re:Hive SQL运行状态监控(HiveSQLMonitor)
- @DATA·CN 大佬,您按照这个方式实现了吗...
- --Angel6688
- 2. Re:若依(RuoYi )权限管理设计
- 数据权限,ruoyi采用的是sql join的形式。感觉不是很好。侵入性很强。 我采用注解判断参数来拦截越权访问。 实现在该项目: 欢迎大佬点评指正。...
- --CoderV的进阶笔记
- 3. Re:若依(RuoYi )权限管理设计
666
- --牛头人363
- 4. Re:微信小程序使用 ECharts
已阅
- --哎呦你可棒棒了
- 5. Re:若依(RuoYi )权限管理设计
收藏了。
- --清风如你