随笔分类 - 大数据
摘要://启动Zookeeper zkServer.sh start//启动redisredis-server /opt/bdp/redis/conf/redis.conf//启动canal/opt/bdp/canal/bin/startup.shkafka-console-consumer.sh --b
阅读全文
摘要:VPQ9LWBJ0Z-eyJsaWNlbnNlSWQiOiJWUFE5TFdCSjBaIiwibGljZW5zZWVOYW1lIjoic2lnbnVwIHNjb290ZXIiLCJhc3NpZ25lZU5hbWUiOiIiLCJhc3NpZ25lZUVtYWlsIjoiIiwibGljZW5zZVJ
阅读全文
摘要:本项目使用命令 Hdfs集群 [root@node01 ~]# start-all.sh Hive 元数据 [root@node01 ~]# hive --service metastore Hiveserver2远程连接 [root@node01 ~]# hiveserver2 kafka启动 [
阅读全文
摘要:Sqoop面试题答案 Sqoop 在工作中的定位是会用就行 Q1:Sqoop导入hdfs的参数 /opt/module/sqoop/bin/sqoop import \--connect \ # 特殊的jdbc连接的字符串--username \--password \--target-dir \
阅读全文
摘要:1、ETL通常有哪些常用的工具和方法?通常在数仓搭建中什么时候进行这个工作?2、Flume通常用来采集什么样的数据?Flume的采集架构是什么样的?3、Flume中拦截器通常起到什么作用?4、Flume的各个采集方案的好处是什么?
阅读全文
摘要:学习思路: 1.需求是什么? 2.方案是什么? 3.逻辑是什么? 4.开发中的问题?怎么解决? 整体流量概况: 1.累计用户量 2.每日新增用户量 3.每日的访问人数、次数 4.每日的全部访问人均次数、时长和深度 5.计算用户平均会话数 6.计算当日访问IP数 7.新老用户访问占比 8.每日新老用户
阅读全文
摘要:大数据技术原理与应用——练习题_lt_BeiMo的博客-程序员秘密 技术标签: Mooc学习 大数据 第一章 大数据概述 1第三次信息化浪潮的标志是: A.互联网的普及 B.云计算、大数据、物联网技术的普及 C.个人电脑的普及 D.虚拟现实技术的普及 2就数据的量级而言,1PB数据是多少TB? A.
阅读全文