06 2022 档案
摘要:1.Spark是什么? 定义:Apache Spark是用于大规模数据处理的统一分析引擎。 RDD是一种分布式内存抽象,其使得程序员能够在大规模集群中做内存运算,并且有一定的容错方式。而这也是整个Spark的核心数据结构,Spark整个平台都围绕着RDD进行 统一分析引擎?spark是一款分布式内存
阅读全文
摘要:1. 前端学习历程: HTML——>内容:网页的骨架,没有任何样式 CSS——>外观:给骨架添加各种样式,变得好看 JavaScript——>动作:控制网页的动态效果 前端框架:BOOTSTRAP,JQuery,Vue 提前给你封装好了很多操作,你只需要按照固定的语法调用即可 2. 软件开发架构:c
阅读全文
摘要:1.必备知识回顾 1)计算机又叫电脑,即通电的大脑,发明计算机是为了让它通电之后能够像人一样去工作,并且它比人的工作效率更高,因为可以24小时不间断 2)计算机五大组成部分 控制器 运算器 存储器 输入设备 输出设备 计算机的核心真正干活的是CPU(控制器+运算器=中央处理器) 3)程序想要被计算机
阅读全文
摘要:1.数仓概念 数据仓库(简称数仓,DW)是一个用于存储,分析,报告的数据系统 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持 数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统 同时数据仓库自身也不需要“消费”任何的数据,其结果开放给各个外部应用使用 这也是为什么叫
阅读全文