2.1

学习了Spark MLlib,它是Spark的机器学习库。今天尝试了简单的线性回归示例。

代码示例:

python
复制
from pyspark.ml.regression import LinearRegression
from pyspark.sql import SparkSession

spark = SparkSession.builder.appName("MLlibExample").getOrCreate()

# 加载数据
data = spark.read.format("libsvm").load("data/sample_linear_regression_data.txt")

# 划分训练集和测试集
train_data, test_data = data.randomSplit([0.7, 0.3])

# 创建线性回归模型
lr = LinearRegression(maxIter=10, regParam=0.3, elasticNetParam=0.8)

# 训练模型
model = lr.fit(train_data)

# 测试模型
predictions = model.transform(test_data)
predictions.show()

spark.stop()

posted @ 2025-02-01 22:57  混沌武士丞  阅读(6)  评论(0)    收藏  举报