12 2020 档案

摘要:安全模式 为什么集群会进入安全模式? NameNode启动 NN启动时,首先将映像文(Fsimage)载入内存,并编辑日志(Edits)中的各项操作.一旦在内存中成功建立元数据的映像,则创建一个新的Fsimage文件和一个空的编辑日志。此时,NameNode开始监听DataNode的请求。这个过程期 阅读全文 »
posted @ 2020-12-24 10:23 Later^^ 阅读(139) 评论(0) 推荐(0) 编辑
摘要:Phoenix SQL总结 建表语句 --建表 create table if not exists "student"( id varchar primary key, name varchar ) --插入数据 upsert into "student"(id,name) values("100 阅读全文 »
posted @ 2020-12-21 21:08 Later^^ 阅读(758) 评论(0) 推荐(0) 编辑
摘要:#awk基本用法 awk是一个强大的文本分析工具 ##基本语法 awk '{pattern + action}' {filenames} ##简单参数设置 场景1:按照一定规则切分这个字段 -F 代表切分规则 默认是空格 $1 表示切分后的第一个字段 $2 awk -F '\t' '{/file/} 阅读全文 »
posted @ 2020-12-15 18:05 Later^^ 阅读(75) 评论(0) 推荐(0) 编辑
摘要:1:HDFS存储多目录 只针对DN进行多目录配置 1)生产环境服务器磁盘情况 2)在hdfs-site.xml文件中配置多目录,注意新挂载磁盘的访问权限问题。 HDFS的DataNode节点保存数据的路径由dfs.datanode.data.dir参数决定,其默认值为file://$/dfs/dat 阅读全文 »
posted @ 2020-12-14 21:22 Later^^ 阅读(677) 评论(0) 推荐(0) 编辑
摘要:集群基准性能测试 问题引入:输入端有2T的数据,问多长时间能把数据上传到集群? 假如说1个小时,那么双11时瞬间产生100T数据,服务器能顶住吗? 因此,我们需要对服务器进行压力测试,对服务器整体性能有精准把控 1)测试HDFS写性能 测试内容,向集群上传10个128M的文件 [root@hadoo 阅读全文 »
posted @ 2020-12-14 19:27 Later^^ 阅读(308) 评论(0) 推荐(0) 编辑
摘要:搭建Linux虚拟机流程 以下教程使用linux版本为Centos7.5 1.配置网络 1)修改虚拟机的静态IP 进入 sudo vim /etc/sysconfig/network-scripts/ifcfg-ens33 修改如下几项配置 BOOTPROTO=static --改成静态IP ONB 阅读全文 »
posted @ 2020-12-14 00:09 Later^^ 阅读(346) 评论(0) 推荐(0) 编辑
摘要:1)创建Topic kafka-topics.sh --create --bootstrap-server hadoop102:9092 --topic second --partitions 2 --replication-factor 3 kafka-topics.sh --create --z 阅读全文 »
posted @ 2020-12-08 19:29 Later^^ 阅读(1631) 评论(0) 推荐(0) 编辑
摘要:从端口读数据读取到本地文件 #1.给三个组件命名 a3.sources = r1 a3.channels = c1 a3.sinks = k1 #2.给source组件属性赋值 a3.sources.r1.type = avro a3.sources.r1.bind = hadoop102 a3.s 阅读全文 »
posted @ 2020-12-07 21:19 Later^^ 阅读(166) 评论(0) 推荐(0) 编辑
摘要:问题:可以连局域网,但是不能连外网 经过检查,发现DNSClient服务没有启动 解决方案 关闭方法:1.按Windows + R ,输入regedit 进入注册表 2.在左侧找到一下路径,或者复制路径到注册表上方的路径位置,按回车。中文版Windows :计算机\HKEY_LOCAL_MACHIN 阅读全文 »
posted @ 2020-12-07 17:15 Later^^ 阅读(3486) 评论(0) 推荐(0) 编辑
摘要:函数总结 date_format:将日期进行格式化 date_add:对当前日期增加天数 next_day:取当前日期的下一个周几 last_day:当前日期的最后一天 regexp_replace: 使用正则表达式匹配目标字符串,匹配成功后替换! case when:类似于java里的switch 阅读全文 »
posted @ 2020-12-04 19:45 Later^^ 阅读(140) 评论(0) 推荐(0) 编辑
摘要:数据库的DDL 建库语法 CREATE DATABASE [IF NOT EXISTS] database_name [IF NOT EXISTS] --增强代码的健壮性 [COMMENT database_comment] --这个库是干嘛的 [LOCATION hdfs_path] --你当前的 阅读全文 »
posted @ 2020-12-02 18:18 Later^^ 阅读(138) 评论(0) 推荐(0) 编辑
摘要:基本数据类型 HIVE MySQL JAVA 长度 例子 TINYINT TINYINT byte 1byte有符号整数 2 SMALINT SMALINT short 2byte有符号整数 20 INT INT int 4byte有符号整数 20 BIGINT BIGINT long 8byte有 阅读全文 »
posted @ 2020-12-02 16:48 Later^^ 阅读(687) 评论(0) 推荐(0) 编辑
摘要:hadoop压缩配置 MR支持的压缩编码 压缩格式 算法 文件扩展名 是否可切分 DEFLATE DEFLATE .deflate 否 Gzip DEFLATE .gz 否 bzip2 bzip2 .bz2 是 LZO LZO .lzo 是 Snappy Snappy .snappy 否 为了支持多 阅读全文 »
posted @ 2020-12-02 16:43 Later^^ 阅读(208) 评论(0) 推荐(0) 编辑
摘要:排序 全局排序(Order by) 对整个输出结果集进行排序,只会产生一个Reduce 每个Reduce内部排序(Sort by) Sort By:对于大规模的数据集order by的效率非常低。在很多情况下,并不需要全局排序,此时可以使用sort by。 Sort by为每个reducer产生一个 阅读全文 »
posted @ 2020-12-01 19:50 Later^^ 阅读(790) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示