随笔分类 -  bdv026-EB实时数仓

上一页 1 2 3 4 下一页

|NO.Z.00060|——————————|BigDataEnd|——————————————————————————————————————
摘要:NO: Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of 阅读全文

posted @ 2022-04-16 14:10 yanqi_vip 阅读(4) 评论(0) 推荐(0) 编辑

|NO.Z.00057|——————————|BigDataEnd|——|Hadoop&实时数仓.V37|——|项目.v37|需求五:数据处理&渠道来源统计.V3|——|编译打印|
摘要:一、启动相关服务:显示:黑名单用户ID、广告ID、点击数 ### 启动相关服务 ~~~ # 启动zookeeper服务 [root@hadoop01 ~]# ./zk.sh start ~~~ # 启动kafka服务:所有节点 [root@hadoop01 ~]# kafka-server-star 阅读全文

posted @ 2022-04-16 14:09 yanqi_vip 阅读(24) 评论(0) 推荐(0) 编辑

|NO.Z.00058|——————————|BigDataEnd|——|Hadoop&实时数仓.V38|——|项目.v38|需求六:数据处理&支付异常.V1|——|需求分析|
摘要:一、需求6:交易支付异常 二、数据格式 9390,1,2020-07-28 00:15:11,295 5990,1,2020-07-28 00:16:12,165 9390,2,2020-07-28 00:18:11,295 5990,2,2020-07-28 00:18:12,165 9390,3 阅读全文

posted @ 2022-04-16 14:09 yanqi_vip 阅读(28) 评论(0) 推荐(0) 编辑

|NO.Z.00055|——————————|BigDataEnd|——|Hadoop&实时数仓.V35|——|项目.v35|需求五:数据处理&渠道来源统计.V1|——|需求分析|
摘要:一、需求5:实时统计各渠道来源用户数量 二、编程实现工具类:SourceKafka package myutils import java.util.Properties import org.apache.flink.api.common.serialization.SimpleStringSch 阅读全文

posted @ 2022-04-16 14:08 yanqi_vip 阅读(17) 评论(0) 推荐(0) 编辑

|NO.Z.00056|——————————|BigDataEnd|——|Hadoop&实时数仓.V36|——|项目.v36|需求五:数据处理&渠道来源统计.V2|——|编程实现|
摘要:一、编程实现:ChanalStatistics:实时统计各渠道来源用户数量 package dw.dws import com.alibaba.fastjson.{JSON, JSONObject} import modes.{ChanalDetail, CountByChannal} import 阅读全文

posted @ 2022-04-16 14:08 yanqi_vip 阅读(37) 评论(0) 推荐(0) 编辑

|NO.Z.00054|——————————|BigDataEnd|——|Hadoop&实时数仓.V34|——|项目.v34|需求四:数据处理&黑名单统计.V3|——|编译打印|
摘要:一、启动相关服务:显示:黑名单用户ID、广告ID、点击数 ### 启动相关服务 ~~~ # 启动zookeeper服务 [root@hadoop01 ~]# ./zk.sh start ~~~ # 启动kafka服务:所有节点 [root@hadoop01 ~]# kafka-server-star 阅读全文

posted @ 2022-04-16 14:07 yanqi_vip 阅读(19) 评论(0) 推荐(0) 编辑

|NO.Z.00051|——————————|BigDataEnd|——|Hadoop&实时数仓.V31|——|项目.v31|需求三:数据处理&增量统计广告.V5|——|编译打印|
摘要:一、启动相关服务 ### 启动相关服务 ~~~ # 启动zookeeper服务 [root@hadoop01 ~]# ./zk.sh start ~~~ # 启动kafka服务:所有节点 [root@hadoop01 ~]# kafka-server-start.sh -daemon /opt/ya 阅读全文

posted @ 2022-04-16 14:06 yanqi_vip 阅读(14) 评论(0) 推荐(0) 编辑

|NO.Z.00052|——————————|BigDataEnd|——|Hadoop&实时数仓.V32|——|项目.v32|需求四:数据处理&黑名单统计.V1|——|需求分析|
摘要:一、需求4:显示:黑名单用户ID、广告ID、点击数 Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both han 阅读全文

posted @ 2022-04-16 14:06 yanqi_vip 阅读(10) 评论(0) 推荐(0) 编辑

|NO.Z.00053|——————————|BigDataEnd|——|Hadoop&实时数仓.V33|——|项目.v33|需求四:数据处理&黑名单统计.V2|——|编程实现|
摘要:一、编程实现:工具类:显示:黑名单用户ID、广告ID、点击数 ### 编程实现:工具类一:SourceKafka package myutils import java.util.Properties import org.apache.flink.api.common.serialization. 阅读全文

posted @ 2022-04-16 14:06 yanqi_vip 阅读(17) 评论(0) 推荐(0) 编辑

|NO.Z.00050|——————————|BigDataEnd|——|Hadoop&实时数仓.V30|——|项目.v30|需求三:数据处理&增量统计广告.V4|——|编程实现|
摘要:一、编程实现:每隔5秒统计最近1小时内广告的点击量$增量统计 package dw.dws import modes.{AdClick, CountByProductAd} import myutils.SourceKafka import java.sql.Date import java.tex 阅读全文

posted @ 2022-04-16 14:05 yanqi_vip 阅读(20) 评论(0) 推荐(0) 编辑

|NO.Z.00049|——————————|BigDataEnd|——|Hadoop&实时数仓.V29|——|项目.v29|需求三:数据处理&增量统计广告.V3|——|编程实现|
摘要:一、编程实现:每隔5秒统计最近1小时内广告的点击量$增量统计 ### 编程实现:工具类一:SourceKafka package myutils import java.util.Properties import org.apache.flink.api.common.serialization. 阅读全文

posted @ 2022-04-16 14:05 yanqi_vip 阅读(19) 评论(0) 推荐(0) 编辑

|NO.Z.00048|——————————|BigDataEnd|——|Hadoop&实时数仓.V28|——|项目.v28|需求三:数据处理&增量统计广告.V2|——|Flume配置|
摘要:一、Flume配置文件: ### flume配置文件:event-conf.properties ~~~ # 写入Flume配置文件:event-conf.properties [root@hadoop02 ~]# vim /opt/yanqi/servers/flume-1.9.0/conf/ev 阅读全文

posted @ 2022-04-16 14:04 yanqi_vip 阅读(28) 评论(0) 推荐(0) 编辑

|NO.Z.00046|——————————|BigDataEnd|——|Hadoop&实时数仓.V26|——|项目.v26|需求二:数据处理&增量统计.V4|——|编译打印|
摘要:一、启动相关服务 ### 启动相关服务 ~~~ # 启动zookeeper服务 [root@hadoop01 ~]# ./zk.sh start ~~~ # 启动kafka服务:所有节点 [root@hadoop01 ~]# kafka-server-start.sh -daemon /opt/ya 阅读全文

posted @ 2022-04-16 14:03 yanqi_vip 阅读(26) 评论(0) 推荐(0) 编辑

|NO.Z.00047|——————————|BigDataEnd|——|Hadoop&实时数仓.V27|——|项目.v27|需求三:数据处理&增量统计广告.V1|——|需求分析|
摘要:一、需求3:每隔5秒统计最近1小时内广告的点击量 增量 二、实现步骤 ### 实现步骤 ~~~ 获取数据源(input) flume ~~~ 转化 ~~~ 数据源的格式:area:uid:product_id:time: 样例类中AdClick;过滤操作filter product_id != nu 阅读全文

posted @ 2022-04-16 14:03 yanqi_vip 阅读(23) 评论(0) 推荐(0) 编辑

|NO.Z.00044|——————————|BigDataEnd|——|Hadoop&实时数仓.V24|——|项目.v24|需求二:数据处理&增量统计.V2|——|编程实现|
摘要:一、编程实现:工具类:每隔5分钟统计最近1小时内的订单交易情况显示城市/省份/交易总金额/订单总数 ### 编程实现:工具类一:ConnHBase package myutils import org.apache.hadoop.conf.Configuration import org.apach 阅读全文

posted @ 2022-04-15 15:04 yanqi_vip 阅读(39) 评论(0) 推荐(0) 编辑

|NO.Z.00045|——————————|BigDataEnd|——|Hadoop&实时数仓.V25|——|项目.v25|需求二:数据处理&增量统计.V3|——|编程实现/redis下沉器|
摘要:一、编程实现:redis下沉器:MySinkToRedis ### 编程实现:redis下沉器:MySinkToRedis package ads import java.util import modes.CityOrder import org.apache.flink.configuratio 阅读全文

posted @ 2022-04-15 15:04 yanqi_vip 阅读(10) 评论(0) 推荐(0) 编辑

|NO.Z.00043|——————————|BigDataEnd|——|Hadoop&实时数仓.V23|——|项目.v23|需求二:数据处理&增量统计.V1|——|需求分析|
摘要:一、需求2:每隔5分钟统计最近1小时内的订单交易情况,显示城市/省份/交易总金额/订单总数 增量统计 二、编程实现流程 ### 读取数据源(input) ~~~ # input读取数据源: input1:mysql:yanqi_area HBase:dim_yanqi_area(地域宽表) # 从h 阅读全文

posted @ 2022-04-15 15:03 yanqi_vip 阅读(29) 评论(0) 推荐(0) 编辑

|NO.Z.00041|——————————|BigDataEnd|——|Hadoop&实时数仓.V21|——|项目.v21|需求一:数据处理&全量查询.V5|——|DWS:hbash:yanqi_trade_orders+dim_yanqi_area生成flink:table中临时表|
摘要:一、编程实现第四层:DWS层数据处理:统计城市、省份订单总额 ### 编程实现第四层:DWS层数据处理:统计城市、省份订单总额 ~~~ dws : 统计城市、省份的订单总额, ~~~ 订单总额和订单总数:orderNo、userId、status、totalMoney、areaId ~~~ ODS— 阅读全文

posted @ 2022-04-15 15:02 yanqi_vip 阅读(19) 评论(0) 推荐(0) 编辑

|NO.Z.00042|——————————|BigDataEnd|——|Hadoop&实时数仓.V22|——|项目.v22|需求一:数据处理&全量查询.V6|——|DWS:hbash:yanqi_trade_orders+dim_yanqi_area生成flink:table中临时表|
摘要:一、启动相关服务 ### 启动相关服务 ~~~ # 启动zookeeper服务 [root@hadoop01 ~]# ./zk.sh start ~~~ # 启动kafka服务:所有节点 [root@hadoop01 ~]# kafka-server-start.sh -daemon /opt/ya 阅读全文

posted @ 2022-04-15 15:02 yanqi_vip 阅读(11) 评论(0) 推荐(0) 编辑

|NO.Z.00040|——————————|BigDataEnd|——|Hadoop&实时数仓.V20|——|项目.v20|需求一:数据处理&全量查询.V4|——|DIM:hbash:yanqi_area~~hbash:dim_yanqi_area|
摘要:一、编程实现第三层:DIM层数据处理 ### 编程实现第三层:DIM层数据处理 ~~~ DIM:同第四部分 dim_yanqi_area表数据 ~~~ hbash:yanqi_area——>hbash:dim_yanqi_area ~~~ 生成hbash:yanqi_area表到hbash:dim_ 阅读全文

posted @ 2022-04-15 15:01 yanqi_vip 阅读(26) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 下一页
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示