12 2023 档案

摘要:大家好,我是独孤风,今天的元数据管理平台Datahub的系列教程,我们来聊一下Datahub CLI。也就是Datahub的客户端。 我们在安装和使用Datahub 的过程中遇到了很多问题。 如何安装Datahub ? 为什么总是拉取镜像? 如何启动Datahub ? 这些Datahub 的Dock 阅读全文
posted @ 2023-12-28 08:52 独孤风 阅读(476) 评论(0) 推荐(0) 编辑
摘要:大家好,我是独孤风。 数据可视化是数据领域一个非常重要的应用。而结合了数据可视化和数据探索功能的BI(商业智能)工具,更是被各大公司青睐。但是,由于数据可视化工具的开发成本过高,长期以来一直是商业化的BI工具处于垄断地位。 那么,有没有优秀的开源数据可视化与数据探索平台呢? 今天为大家推荐的开源项目 阅读全文
posted @ 2023-12-26 09:14 独孤风 阅读(1008) 评论(1) 推荐(0) 编辑
摘要:大家好,我是独孤风。 这几年数据治理爆火,但迟迟没有一个优秀的开源数据治理平台的出现。很多公司选择元数据管理平台作为基础,再构建数据质量,数据血缘等工具。 今天为大家推荐的开源项目,是一个一体化的数据治理平台,一个平台解决了大部分问题。让我们一起来看看吧~ OpenMetadata是一个用于数据治理 阅读全文
posted @ 2023-12-25 16:42 独孤风 阅读(1653) 评论(0) 推荐(0) 编辑
摘要:2023年是人工智能爆火的一年,ChatGPT为首的一系列的大模型的出现,让生成式人工智能彻底火了一把。但有人会说,GPT对于我们数据开发来说并没有什么作用啊? 今天为大家推荐的开源项目,就是GPT在数据领域的一个优秀实践项目。让我们一起来看看吧~ Chat2DB是一个集成了ChatGPT功能的数据 阅读全文
posted @ 2023-12-12 09:25 独孤风 阅读(978) 评论(0) 推荐(0) 编辑
摘要:大家好,我是独孤风,大数据流动的作者。 本文基于最新的 Hadoop 3.3.6 的版本编写,带大家通过单机版充分了解 Apache Hadoop 的使用。本文更强调实践,实践是大数据学习的重要环节,也能在实践中对该技术有更深的理解,所以一些理论知识建议大家多阅读相关的书籍(都在资料包中)。 本文档 阅读全文
posted @ 2023-12-06 11:07 独孤风 阅读(1161) 评论(0) 推荐(0) 编辑
摘要:大家好,我是独孤风,从本周开始,争取每周为大家带来一个优秀的开源项目推荐。 开源项目不仅促进了技术的发展和普及,还为全球范围内的开发者和用户社区建立了一个共享知识、协作和创新的平台。站在巨人的肩膀上才能看的更远,我们平时也应该多多关注开源项目,不仅学习其丰富的知识,也要找机会为开源事业做出自己的贡献 阅读全文
posted @ 2023-12-05 08:05 独孤风 阅读(4406) 评论(0) 推荐(1) 编辑
摘要:Apache Paimon是一个流式数据湖平台。致力于构建一个实时、高效的流式数据湖平台。这个项目采用了先进的流式计算技术,使企业能够实时处理和分析大量数据。Apache Paimon 的核心优势在于它对于大数据生态系统中流式处理的支持,尤其是在高并发和低延迟方面表现出色。 目前业界主流数据湖存储格 阅读全文
posted @ 2023-12-01 09:11 独孤风 阅读(199) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示