12 2022 档案
摘要:VPQ9LWBJ0Z-eyJsaWNlbnNlSWQiOiJWUFE5TFdCSjBaIiwibGljZW5zZWVOYW1lIjoic2lnbnVwIHNjb290ZXIiLCJhc3NpZ25lZU5hbWUiOiIiLCJhc3NpZ25lZUVtYWlsIjoiIiwibGljZW5zZVJ
阅读全文
摘要:大数据时代对于数据分析、数据营销的要求越来越迫切,无论是对外的业务系统,还是对内的系统,业务人员都希望以数据为支撑,进行产品策略制定支撑、用户运营打法制定。使用数据库来做数据摸底、数据分析,既费时费力,也效果不好,最合适的方式便是数据仓库了,轻量又实用。 数据仓库,一个面向主题的、集成的、相对稳定的
阅读全文
摘要:本项目使用命令 Hdfs集群 [root@node01 ~]# start-all.sh Hive 元数据 [root@node01 ~]# hive --service metastore Hiveserver2远程连接 [root@node01 ~]# hiveserver2 kafka启动 [
阅读全文
摘要:思路: 题目要求我们统计每篇文章的同一时刻最大在线人数,所以我们观察表结构,通过进入时间和离开时间我们知道一个用户什么时候在线,什么时候不在线 也就是说一个int time代表在线人数+1,一个out time代表在线人数-1,所以我们需要在时间戳后面加一个伪列 但此时的表结构显然是不符合我们的需求
阅读全文