随笔分类 -  Spark

有关Spark的学习笔记。
摘要:基于MLlib的机器学习(操作向量、特征提取、特征标准化、分类、回归、聚类、降维) 阅读全文
posted @ 2020-09-23 11:52 Alvin_Ai 阅读(385) 评论(0) 推荐(0) 编辑
摘要:Spark SQL和Beeline 阅读全文
posted @ 2020-09-22 23:19 Alvin_Ai 阅读(1991) 评论(0) 推荐(0) 编辑
摘要:Spark调优(并行度调优、序列化格式优化、内存管理优化、Spark SQL性能优化) 阅读全文
posted @ 2020-09-22 20:53 Alvin_Ai 阅读(196) 评论(0) 推荐(0) 编辑
摘要:Spark在集群上运行的知识点 阅读全文
posted @ 2020-09-22 20:17 Alvin_Ai 阅读(400) 评论(0) 推荐(0) 编辑
摘要:Spark常见数据源(文件格式与文件系统:文本文件\JSON\CSV\SequenceFile;Spark SQL中的结构化数据源;数据库与键值存储) 阅读全文
posted @ 2020-09-22 10:57 Alvin_Ai 阅读(2464) 评论(0) 推荐(0) 编辑
摘要:RDD:创建RDD和操作RDD(转化操作和行动操作) 阅读全文
posted @ 2020-09-21 20:53 Alvin_Ai 阅读(334) 评论(0) 推荐(0) 编辑
摘要:Spark的安装及介绍 阅读全文
posted @ 2020-09-21 18:09 Alvin_Ai 阅读(1085) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示