上一页 1 2 3 4 5 6 ··· 17 下一页
摘要: 在上一篇分享中,我们介绍了ClickHouse的安装部署和简单使用。本文将介绍ClickHouse中一个非常重要的概念—表引擎(ta... 阅读全文
posted @ 2020-09-21 21:38 大数据技术与数仓 阅读(6912) 评论(0) 推荐(1) 编辑
摘要: ClickHouse简介 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。ClickHouse最... 阅读全文
posted @ 2020-09-13 21:27 大数据技术与数仓 阅读(3481) 评论(0) 推荐(0) 编辑
摘要: 现如今,Kafka已不再是一个单纯的消息队列系统。Kafka是一个分布式的流处理平台,被越来越多的公司使用,Kafka可以被用于高性... 阅读全文
posted @ 2020-09-12 15:06 大数据技术与数仓 阅读(1116) 评论(0) 推荐(0) 编辑
摘要: hive是基于Hadoop的一个数据仓库工具,用来进行数据的ETL,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机... 阅读全文
posted @ 2020-09-12 15:05 大数据技术与数仓 阅读(735) 评论(0) 推荐(0) 编辑
摘要: 本文会从一个商务分析案例入手,说明SQL窗口函数的使用方式。通过本文的5个需求分析,可以看出SQL窗口函数的功能十分强大,不仅能够使... 阅读全文
posted @ 2020-09-06 16:58 大数据技术与数仓 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 用户行为日志分析是实时数据处理很常见的一个应用场景,比如常见的PV、UV统计。本文将基于Flink从0到1构建一个用户行为日志分析系... 阅读全文
posted @ 2020-08-30 21:35 大数据技术与数仓 阅读(359) 评论(0) 推荐(0) 编辑
摘要: 用户行为日志分析是实时数据处理很常见的一个应用场景,比如常见的PV、UV统计。本文将基于Flink从0到1构建一个用户行为日志分析系统,包括架构设计与代码实现。本文分享将完整呈现日志分析系统的数据处理链路,通过本文,你可以了解到: 基于discuz搭建一个论坛平台 Flume日志收集系统使用方式 A 阅读全文
posted @ 2020-08-30 21:35 大数据技术与数仓 阅读(2216) 评论(0) 推荐(0) 编辑
摘要: 元数据管理是数据仓库的核心,它不仅定义了数据仓库有什么,还指明了数据仓库中数据的内容和位置,刻画了数据的提取和转换规则,存储了与数据... 阅读全文
posted @ 2020-08-22 16:24 大数据技术与数仓 阅读(1080) 评论(0) 推荐(0) 编辑
摘要: SQL 语言无处不在。SQL 已经不仅仅是技术人员的专属技能了,似乎人人都会写SQL,就如同人人都是产品经理一样。如果你是做后台开发... 阅读全文
posted @ 2020-08-22 15:25 大数据技术与数仓 阅读(338) 评论(0) 推荐(0) 编辑
摘要: 实时数仓主要是为了... 阅读全文
posted @ 2020-08-17 08:31 大数据技术与数仓 阅读(1561) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 17 下一页