摘要: 本文记录木东居士数仓主题分享内容 分享地址:https://www.bilibili.com/video/av96469217 导读 技能干货:主题域划分规则;数据集市与主题域如何衔接;数据治理之数据标准化;数据中台;实时数仓;传统数仓与互联网数仓异同 职业发展:数仓困境-善战者无赫赫战功;除了技术 阅读全文
posted @ 2021-01-03 22:13 foolangirl 阅读(678) 评论(0) 推荐(0) 编辑
摘要: Schema是什么 DataFrame中的数据结构信息,即为schema。DataFrame中提供了详细的数据结构信息,从而使得SparkSQL可以清楚地知道该数据集中包含哪些列,每列的名称和类型各是什么。 自动推断生成schema 使用spark的示例文件people.json, 查看数据: [r 阅读全文
posted @ 2021-01-03 16:43 foolangirl 阅读(2639) 评论(0) 推荐(0) 编辑
摘要: 转载: https://blog.csdn.net/HappyRocking/article/details/79885071?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control&depth_ 阅读全文
posted @ 2021-01-03 11:02 foolangirl 阅读(309) 评论(0) 推荐(0) 编辑