随笔分类 -  大数据之路

我的大数据学习之路
摘要:什么是 Doris? Apache Doris 是一个基于 MPP(大规模并行处理) 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较 阅读全文
posted @ 2022-11-29 21:02 女友在高考 阅读(381) 评论(0) 推荐(0) 编辑
摘要:一、HDFS优缺点 优点: 高容错性 数据自动保存多个副本 某一个副本丢失后,它可以自动恢复 适合处理大数据 数据规模,可以达到PB级 文件规模,能够处理百万规模的文件数量 可构建在廉价机器上,通过多副本保证可靠性 缺点: 不适合低延时数据访问 不适合对大量小文件进行存储 存储大量小文件,他会占用N 阅读全文
posted @ 2020-06-01 22:57 女友在高考 阅读(245) 评论(0) 推荐(0) 编辑
摘要:一、部署Hadoop本地模式 搭建linux环境 我用的centos7 在/opt目录下创建目录 mkdir module 安装jdk 下载hadoop https://hadoop.apache.org/releases.html 并解压到/opt/module目录 配置hadoop环境变量 vi 阅读全文
posted @ 2020-05-24 23:01 女友在高考 阅读(924) 评论(0) 推荐(0) 编辑