随笔分类 -  AI

摘要:HDFS的读写流程 HDFS读流程 这个图有点别扭,客户端Client放在了右边,不过无伤大雅。 客户端要读取数据,首先是向client发送请求,告诉它要读取某一文件,客户端接到请求后,返回相应的元数据信息。获取到元数据信息后,客户端通过FSDataInputStream依次读取各个datanode 阅读全文
posted @ 2021-09-28 09:46 JunanP 阅读(8) 评论(0) 推荐(0) 编辑
摘要:Hive是什么 Hive 是 Hadoop 家族中一款数据仓库产品,Hive 最大的特点就是提供了类 SQL 的语法,封装了底层的 MapReduce 过程,让有 SQL 基础的业务人员,也可以通过SQL直接利用 Hadoop 进行大数据的操作。像我一开始学习MapReduce的时候,就是通过一个个 阅读全文
posted @ 2021-09-27 18:07 JunanP 阅读(13) 评论(0) 推荐(0) 编辑
摘要:HDFS文件系统 HDFS全拼Hadoop Distributed File System 即Hadoop的分布式文件系统,它其实就是以文件块(block)的形式来存储文件。 在HDFS中,文件被切分为固定大小的数据块,数据块大小默认为64M(也可以设置成其它大小),如果文件大小未超过64M,也会单 阅读全文
posted @ 2021-09-27 16:21 JunanP 阅读(5) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示