随笔分类 - 大数据之路
我的大数据学习之路
摘要:什么是 Doris? Apache Doris 是一个基于 MPP(大规模并行处理) 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较
阅读全文
摘要:一、HDFS优缺点 优点: 高容错性 数据自动保存多个副本 某一个副本丢失后,它可以自动恢复 适合处理大数据 数据规模,可以达到PB级 文件规模,能够处理百万规模的文件数量 可构建在廉价机器上,通过多副本保证可靠性 缺点: 不适合低延时数据访问 不适合对大量小文件进行存储 存储大量小文件,他会占用N
阅读全文
摘要:一、部署Hadoop本地模式 搭建linux环境 我用的centos7 在/opt目录下创建目录 mkdir module 安装jdk 下载hadoop https://hadoop.apache.org/releases.html 并解压到/opt/module目录 配置hadoop环境变量 vi
阅读全文