摘要:
知识点: MLlib 组成:基础统计、分类、回归、聚类、协同过滤、特征工程 数据类型:Vector(稠密向量、稀疏向量)、LabeledPoint(带标签的数据) 特征工程基础:StringIndexer、OneHotEncoder、VectorAssembler 练习: 创建稠密向量和稀疏向量,构 阅读全文
posted @ 2026-02-05 12:06
再报错就堵桥0
阅读(4)
评论(0)
推荐(0)
摘要:
知识点: 逻辑回归原理:二分类算法,基于线性回归的概率映射 MLlib 流水线(Pipeline):Pipeline、PipelineStage、Fit、Transform 模型评估:BinaryClassificationEvaluator(二分类评估) 练习: 用逻辑回归实现鸢尾花二分类,使用 阅读全文
posted @ 2026-02-05 12:06
再报错就堵桥0
阅读(4)
评论(0)
推荐(0)
摘要:
知识点: GraphX 核心概念:顶点(Vertex)、边(Edge)、三元组(Triplet) 图的存储结构:顶点 RDD、边 RDD、三元组 RDD GraphX 与 Spark Core 的关系:基于 RDD 实现的图计算框架(Python 不支持,用 Scala 演示) 练习: 用 Scal 阅读全文
posted @ 2026-02-05 12:06
再报错就堵桥0
阅读(4)
评论(0)
推荐(0)

浙公网安备 33010602011771号