摘要: DataFrame基础 + 示例,为了自查方便汇总了关于PySpark-dataframe相关知识点,集合了很多篇博客和知乎内容,结合了自身实践,加上了更多示例和讲解方便理解,本文内容较多配合目录看更方便。 如有任何问题或者文章错误欢迎大家留言批评指正,感谢阅读。 什么是DataFrame? Dat 阅读全文
posted @ 2021-08-14 16:56 oceaning 阅读(733) 评论(0) 推荐(0) 编辑
摘要: 数据工作框架 1、数据源 通过业务对象、规则与过程数字化,不断提升数据质量,建立清洁、可靠的数据源 2、数据湖 通过物理与虚拟入湖两种方式 汇聚内外部数据 3、主题数据联接 规划和驱动双驱动,建立主题联接,通过服务支撑数据消费 4、数据消费 对准数据消费场景,提供统一数据分析平台,满足 自助式数据消 阅读全文
posted @ 2021-08-14 12:12 oceaning 阅读(165) 评论(0) 推荐(0) 编辑