上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 40 下一页
摘要: 什么是维度 维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实” ,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。 例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。 什么是维度属性 **维度所包含的表示维度的列,称为维度属性。**维度属性是查询约束 阅读全文
posted @ 2021-06-11 11:19 Binge-和时间做朋友 阅读(882) 评论(0) 推荐(0) 编辑
摘要: 1. 检查当前系统是否安装过mysql [root@yum ~]# rpm -qa|grep mariadb mariadb-libs-5.5.68-1.el7.x86_64 #已经存在 # 存在则先卸载 [root@yum ~]# rpm -e --nodeps mariadb-libs 2. 检 阅读全文
posted @ 2021-06-06 22:47 Binge-和时间做朋友 阅读(673) 评论(0) 推荐(1) 编辑
摘要: 环境准备 CentOS:7.0 JDK:1.8 Flink 集群:node-01(Master)、node-02(Slave)、node-03(Slave) 安装与配置 SFTP 上传 Flink 安装包并解压 [root@node-01 ~]# tar -zxvf flink-1.9.0-bin- 阅读全文
posted @ 2021-05-31 21:49 Binge-和时间做朋友 阅读(275) 评论(0) 推荐(0) 编辑
摘要: 引言 spark 在读取 csv 文件时,可能会涉及到很多参数设置,这篇文章总结了 option 里面的参数,希望能够对你有所帮助 option 参数详解 参数 解释 sep 默认是, 指定单个字符分割字段和值 encoding 默认是uft-8通过给定的编码类型进行解码 quote 默认是“,其中 阅读全文
posted @ 2021-05-31 17:12 Binge-和时间做朋友 阅读(2970) 评论(0) 推荐(0) 编辑
摘要: 安装准备 Spark 集群和 Hadoop 类似,也是采用主从架构,Spark 中的主服务器进程就叫 Master(standalone 模式),从服务器进程叫 Worker Spark 集群规划如下: node-01:Master node-02:Worker node-03:Worker 安装步 阅读全文
posted @ 2021-05-20 08:51 Binge-和时间做朋友 阅读(241) 评论(0) 推荐(1) 编辑
摘要: 建立一个后缀为 .reg 的注册文件,拷贝以下内容并替换相关路径,保存病双击文件运行加入注册表。 Windows Registry Editor Version 5.00 [HKEY_CLASSES_ROOT\*\shell\NotePad++] @="Open with Notepad++" "I 阅读全文
posted @ 2021-05-10 19:55 Binge-和时间做朋友 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 安装准备 由于 Scala 运行于 Java 平台,因此 Scala 之前需要确保系统安装 JDK Windows 中安装 Scala 1. 下载 scala-2.11.2.msi 安装包 点击安装文件,下一步完成安装 2. 配置环境变量 SCALA_HOME Scala 安装完成后会自动将 Sca 阅读全文
posted @ 2021-05-10 15:02 Binge-和时间做朋友 阅读(249) 评论(0) 推荐(1) 编辑
摘要: 引言 在 Scala 中,下划线 _ 有很多种用法,作为 Scala 初学者也经常被下划线 _ 搞得晕头转向,下面是对 Scala 中下划线 _ 使用的简单总结~ 导包时, 下划线 _ 表示引用多个方法,和 java 中的 * 类似 import scala.collection.mutable._ 阅读全文
posted @ 2021-05-04 15:58 Binge-和时间做朋友 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 环境准备 CentOS:7.x JDK:1.8 ZooKeeper:3.4.6 Kafka 集群:node-01、node-02、node-03 安装与配置 SFTP 上传 Kafka 安装包并解压 [root@node-01 ~]# tar -zxvf kafka_2.13-2.7.0.tgz - 阅读全文
posted @ 2021-04-30 10:59 Binge-和时间做朋友 阅读(176) 评论(0) 推荐(1) 编辑
摘要: 引言 提起成熟的消息队列或消息引擎,毋庸置疑,大多数人的第一反应一定是 Kafka。 Kafka 能够彻底满足海量数据场景下高吞吐、高并发需求,在短短几年内,已经被阿里、腾讯、百度、字节跳动、Netflix、Twitter 等超一线大厂视为技术核心——可以说,Kafka 是目前大数据 Spark 实 阅读全文
posted @ 2021-04-30 10:32 Binge-和时间做朋友 阅读(859) 评论(0) 推荐(0) 编辑
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 40 下一页