导航
统计
- 随笔 - 105
- 文章 - 0
- 评论 - 53
- 阅读 - 39万
05 2015 档案
-
Hadoop MapReduce中压缩技术的使用
摘要:CompressionandInputSplits当我们使用压缩数据作为MapReduce的输入时,需要确认数据的压缩格式是否支持切片?假设HDFS中有一个未经压缩的大小为1GB的文本文件,如果HDFS Block大小为128MB,那么这个文件会被HDFS存储为8个Block。当MapReduce ... 阅读全文
-
Hadoop Compression
摘要:文件压缩主要有两方面的好处:一方面节省文件存储空间;另一方面加速网络数据传输或磁盘读写。当处理大规模的数据时这些效果提升更加明显,因此我们需要仔细斟酌压缩在Hadoop环境下的使用。目前已经存在很多压缩格式、工具和算法,各有特点,如下图:说明:a. DEFLATE是一种压缩算法,标准实现是zlib,... 阅读全文
-
Hadoop FileInputFormat实现原理及源码分析
摘要:FileInputFormat(org.apache.hadoop.mapreduce.lib.input.FileInputFormat)是专门针对文件类型的数据源而设计的,也是一个抽象类,它提供两方面的作用:(1)定义Job输入文件的静态方法;(2)为输入文件形成切片的通用实现;至于如何将切片中... 阅读全文
-
Hadoop InputFormat
摘要:Hadoop可以处理不同数据格式(数据源)的数据,从文本文件到(非)关系型数据库,这很大程度上得益于Hadoop InputFormat的可扩展性设计,InputFormat层次结构图如下:InputFormat(org.apache.hadoop.mapreduce.InputFormat)被设计... 阅读全文
-
Yarn应用程序运行流程剖析
摘要:Yarn(Yet Another Resource Negotiator)是一个Hadoop集群资源管理系统,Hadoop2时被引入,旨在提高MapReduce的性能,但YARN已足够通用,使得它可以支持其它的分布式应用。Yarn本身提供了一系列API用于用户应用程序与集群资源进行交互,这些API复... 阅读全文
搜索
随笔分类
- AnalysisQL(3)
- Beeline(1)
- Camus(1)
- Design Patterns(1)
- Docker(1)
- Element+(1)
- FairScheduler(1)
- Flume(1)
- Git(2)
- Go(1)
- Hadoop(18)
- HBase(8)
- Hive(11)
- HiveServer2(4)
- Infrastructure(5)
- Java(12)
- Kafka(3)
- Linux(1)
- MySQL(1)
- Python(11)
- Spark(18)
- Spark SQL(3)
- Spark Streaming(2)
- SpringBoot(2)
- Storm(1)
- Vue3(2)
- Yarn(5)
- 创业(1)
- 大数据(1)
- 技术(3)
- 技术杂谈(4)
- 简言编程(Python)(2)
- 妹子、代码与猫(20)
- 数据仓库(2)
- 团队管理(2)
- 微服务(1)
- 小程序(3)
- 更多
随笔档案
- 2023年2月(1)
- 2023年1月(1)
- 2022年9月(5)
- 2022年6月(1)
- 2022年5月(5)
- 2022年4月(2)
- 2022年3月(6)
- 2022年2月(1)
- 2022年1月(2)
- 2021年12月(7)
- 2021年11月(1)
- 2020年8月(1)
- 2020年7月(1)
- 2020年6月(1)
- 2020年5月(5)
- 2020年2月(3)
- 2019年9月(1)
- 2018年5月(1)
- 2017年5月(1)
- 2016年7月(1)
- 2016年6月(5)
- 2016年5月(1)
- 2016年2月(1)
- 2015年12月(3)
- 2015年11月(7)
- 2015年10月(5)
- 2015年8月(7)
- 2015年7月(2)
- 2015年5月(5)
- 2015年4月(2)
- 2015年3月(1)
- 2015年2月(2)
- 2015年1月(4)
- 2014年12月(5)
- 2014年11月(1)
- 2014年2月(2)
- 2014年1月(5)
- 更多
最新评论
- 1. Re:Hive SQL运行状态监控(HiveSQLMonitor)
- @DATA·CN 大佬,您按照这个方式实现了吗...
- --Angel6688
- 2. Re:若依(RuoYi )权限管理设计
- 数据权限,ruoyi采用的是sql join的形式。感觉不是很好。侵入性很强。 我采用注解判断参数来拦截越权访问。 实现在该项目: 欢迎大佬点评指正。...
- --CoderV的进阶笔记
- 3. Re:若依(RuoYi )权限管理设计
666
- --牛头人363
- 4. Re:微信小程序使用 ECharts
已阅
- --哎呦你可棒棒了
- 5. Re:若依(RuoYi )权限管理设计
收藏了。
- --清风如你