摘要: 相比于pandas,pyspark的dataframe的接口和sql类似,比较容易上手。 搭建python3环境 建议使用miniconda3 下载地址:https://mirrors.bfsu.edu.cn/anaconda/miniconda/ 选择py37版本 conda镜像配置:https: 阅读全文
posted @ 2020-12-05 22:16 一支小白 阅读(1090) 评论(0) 推荐(0) 编辑
摘要: 下载地址 https://archive.cloudera.com/hwx-sandbox/hdp/hdp-3.0.1/HDP_3.0.1_vmware_181205.ovavmware导入即可,网络使用桥接,不然可能无法打开。 文档 https://www.cloudera.com/tutoria 阅读全文
posted @ 2020-12-05 21:29 一支小白 阅读(383) 评论(0) 推荐(0) 编辑