上一页 1 2 3 4 5 6 7 8 ··· 17 下一页
摘要: 本文主要介绍Hive的架构和以及HQL的查询阶段,主要内容包括: Hive的架构架构中的相关组件介绍HQL的查询阶段 Hive的架构... 阅读全文
posted @ 2020-08-07 23:02 大数据技术与数仓 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 当我们在使用Flink的时候,避免不了要和时间(time)、水位线(watermarks)打交道,理解这些概念是开发分布式流处理应用... 阅读全文
posted @ 2020-08-07 22:52 大数据技术与数仓 阅读(675) 评论(0) 推荐(0) 编辑
摘要: Flink总共有三种时间语义:Processing time(处理时间)、Event time(事件时间)以及Ingestion t... 阅读全文
posted @ 2020-08-07 22:46 大数据技术与数仓 阅读(407) 评论(0) 推荐(0) 编辑
摘要: 在Flink Table API & SQL编程指南(1)一文中介绍了Flink Table API &SQL的一些基本的概念和通用... 阅读全文
posted @ 2020-08-07 22:44 大数据技术与数仓 阅读(201) 评论(0) 推荐(0) 编辑
摘要: SQL是大数据从业者的必备技能,大部分的大数据技术框架也都提供了SQL的解决方案。可以说SQL是一种经久不衰、历久弥新的编程语言。尤... 阅读全文
posted @ 2020-08-07 13:46 大数据技术与数仓 阅读(223) 评论(0) 推荐(0) 编辑
摘要: ... 阅读全文
posted @ 2020-08-07 08:30 大数据技术与数仓 阅读(202) 评论(0) 推荐(1) 编辑
摘要: 本文... 阅读全文
posted @ 2020-08-05 08:30 大数据技术与数仓 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 本文主要在Spark平台下实现一个机器学习应用,该应用主要涉及LDA主题模型以及K-means聚类。通过本文你可以了解到: 文本挖掘... 阅读全文
posted @ 2020-08-04 22:47 大数据技术与数仓 阅读(401) 评论(0) 推荐(0) 编辑
摘要: MLlib是Spa... 阅读全文
posted @ 2020-08-04 08:28 大数据技术与数仓 阅读(150) 评论(0) 推荐(0) 编辑
摘要: MLlib是Spark提供的一个机器学习库,通过调用MLlib封装好的算法,可以轻松地构建机器学习应用。它提供了非常丰富的机器学习... 阅读全文
posted @ 2020-08-03 22:51 大数据技术与数仓 阅读(282) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 17 下一页