12 2022 档案

摘要:VPQ9LWBJ0Z-eyJsaWNlbnNlSWQiOiJWUFE5TFdCSjBaIiwibGljZW5zZWVOYW1lIjoic2lnbnVwIHNjb290ZXIiLCJhc3NpZ25lZU5hbWUiOiIiLCJhc3NpZ25lZUVtYWlsIjoiIiwibGljZW5zZVJ 阅读全文
posted @ 2022-12-26 16:53 飞翔的小鸟er 阅读(2593) 评论(1) 推荐(3) 编辑
摘要:大数据时代对于数据分析、数据营销的要求越来越迫切,无论是对外的业务系统,还是对内的系统,业务人员都希望以数据为支撑,进行产品策略制定支撑、用户运营打法制定。使用数据库来做数据摸底、数据分析,既费时费力,也效果不好,最合适的方式便是数据仓库了,轻量又实用。 数据仓库,一个面向主题的、集成的、相对稳定的 阅读全文
posted @ 2022-12-12 19:39 飞翔的小鸟er 阅读(671) 评论(0) 推荐(0) 编辑
摘要:本项目使用命令 Hdfs集群 [root@node01 ~]# start-all.sh Hive 元数据 [root@node01 ~]# hive --service metastore Hiveserver2远程连接 [root@node01 ~]# hiveserver2 kafka启动 [ 阅读全文
posted @ 2022-12-08 13:53 飞翔的小鸟er 阅读(111) 评论(0) 推荐(0) 编辑
摘要:思路: 题目要求我们统计每篇文章的同一时刻最大在线人数,所以我们观察表结构,通过进入时间和离开时间我们知道一个用户什么时候在线,什么时候不在线 也就是说一个int time代表在线人数+1,一个out time代表在线人数-1,所以我们需要在时间戳后面加一个伪列 但此时的表结构显然是不符合我们的需求 阅读全文
posted @ 2022-12-02 08:49 飞翔的小鸟er 阅读(37) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示