随笔分类 -  数据辅助资料

摘要:1、Hdfs的block和spark的partition有什么区别吗? 在hdfs中的block是分布式存储的最小单元,等分,并且可以设置冗余,这样设计会出现一部分磁盘空间的浪费,但是整齐的block大小,便于快速找到,读取对应的内容,例如快手利用hdfs来进行存储视频。 Spark中的pariti 阅读全文
posted @ 2021-07-06 18:19 欣欣姐 阅读(261) 评论(0) 推荐(0) 编辑
摘要:一、hive架构相关 可以结合平时使用hive的经验作答,也可以结合下图从数据的读入、解析、元数据的管理,数据的存储等角度回答: 二、hive的特点 本题主要为了考察对hive的整体使用场景的掌握程度,毕竟只有知道了hive的特点,才能有针对性的在实际项目中的合适场景下使用hive。 可以从下面四个 阅读全文
posted @ 2021-06-29 11:40 欣欣姐 阅读(347) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示