superset的安装和使用
第 1 章 Superset 入门
1.1 Superset 概述
Apache Superset 是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接
各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义
仪表盘。
1.2 环境说明
本课程使用的服务器操作系统为 CentOS 7,Superset 对接的数据源为 MySQL 数据库。
这里咋们就用node03就可以,因为MySQL在node03上面。
第 2 章 Superset 安装
Superset 官网地址:http://superset.apache.org/
2.1 安装 Python 环境
Superset 是由 Python 语言编写的 Web 应用,要求 Python3.6 的环境。
python -V:可以查看当前系统的版本。
2.1.1 安装 Miniconda
conda(anaconda) 是一个开源的包、环境管理器,可以用于在同一个机器上安装不同 Python 版本的
软件包及其依赖,并能够在不同的 Python 环境之间切换,Anaconda 包括 Conda、Python 以
及一大堆安装好的工具包,比如:numpy、pandas 等,Miniconda 包括 Conda、Python。
此处,我们不需要如此多的工具包,故选择 MiniConda。
·1)下载 Miniconda(Python3 版本)
···· 下载地址:https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
2)安装 Miniconda
在softwars里面创建一个目录用来存miniconda:
然后上传这个miniconda:
(1)执行以下命令进行安装,并按照提示操作,直到安装完成。
bash Miniconda3-latest-Linux-x86_64.sh
按回车继续安装
(2)在安装过程中,出现以下提示时,可以指定安装路径
(3)出现以下字样,即为安装完成
3)加载环境变量配置文件,使之生效
source ~/.bashrc
4)取消激活 base 环境
Miniconda 安装完成后,每次打开终端都会激活其默认的 base 环境,我们可通过以下命
令,禁止激活默认 base 环境。
conda config --set auto_activate_base false
#然后咋们在从新开一个窗口:
conda的一些常用命令:
说明:conda 环境管理常用命令
创建环境:conda create -n 环境名称(自定义) python=3.7
查看所有环境:conda info --envs
删除一个环境:conda remove -n 环境的名称 --all
激活 base环境
conda activate base
说明:退出当前环境
conda deactivate
# 注意:只能是3.6,其他版本我试过了不行的2.1.2 创建 Python3.6 环境,注意:只能是3.6,其他版本我试过了不行的
1)配置 conda 国内镜像
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --set show_channel_urls yes
查看是否配置成功:
cd
cat .condarc
#注意一定要联网哦
2)创建superset的环境为 Python3.6 环境
conda create --name superset python=3.6
查看所有环境:conda info --envs
3)激活 superset 环境
conda activate superset
说明:退出当前环境
conda deactivate
2.2 Superset 部署
2.2.1 安装依赖
安装 Superset 之前,需安装以下所需依赖(系统依赖)
在咋们python3.6环境下,也就是在咋们创建的superset环境下
yum install -y python-setuptools
yum install -y gcc gcc c++ libffi-devel python-devel python-pip python-wheel python setuptools openssl-devel cyrus-sasl-devel openldap-devel
2.2.2 安装 Superset
1)安装(更新)setuptools 和 pip(就是更新python的pip库)
还是在superset环境下:
pip install --upgrade setuptools pip -i https://pypi.douban.com/simple/
说明:pip 是 python 的包管理工具,可以和 centos 中的 yum 类比
pip -i :是指定国内的镜像,让pip去国内的镜像进行更新。
2)安装 Supetset
pip install apache-superset -i https://pypi.douban.com/simple/
说明:-i 的作用是指定镜像,这里选择国内镜像
注:如果遇到网络错误导致不能下载,可尝试更换镜像 (如果superset没用安装成功,尝试下这个命令)
pip install apache-superset --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple
3)初始化 Supetset 数据库
#先升级一下组件,要不然要报错
pip install tushare --upgrade
pip install sqlalchemy==1.3.24
pip install dataclasses
开始初始化数据库
superset db upgrade
#恭喜你成功了。
4)创建管理员用户,用于登录superset
export FLASK_APP=superset
superset fab create-admin
说明:flask 是一个 python web 框架,Superset 使用的就是 flask
这里我的登录账号和密码都是root
5)Superset 初始化
superset init
2.2.3 启动 Supterset,因为启动superset需要gunicorn去启动,这里我们安装一下gunicorn命令
1)安装 gunicorn
pip install gunicorn -i https://pypi.douban.com/simple/
说明:gunicorn 是一个 Python Web Server,可以和 java 中的 TomCat 类比
2)启动 Superset
(1)确保当前 conda 环境为 superset,及下图所示
(2)启动
gunicorn --workers 5 --timeout 120 --bind node03:8787 "superset.app:create_app()" --daemon
说明:
--workers:指定进程个数
--timeout:worker 进程超时时间,超时会自动重启
--bind:绑定本机地址,即为 Superset 访问地址
--daemon:后台运行
(3)登录 Superset
访问 http://node03:8787,并使用 2.2.2 节中第 4 步创建的管理员账号进行登录。
卸载superset的方式:
退出环境
conda deactivate
删除superset
conda remove -n superset --all
以及删除数据库,以解决Error! User already exists
cd ~/.superset/
rm -f superset.db
到此,superset的安装和卸载就完成了,他的使用我后续更新。
有任何问题qq:2724904118
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)