随笔- 6 文章- 0 评论- 0 阅读- 167

随机森林（数据思维赛-家电能源预测）

训练集给出如下数据：

测试集提供其中的部分列：

要求预测以下列的数据：

['Tdewpoint', 'Visibility', 'Windspeed', 'RH_out', 'Press_mm_hg', 'RH_9', 'T_out', 'RH_4']

使用随机森林进行预测：

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

# 读入训练数据和测试数据
train_data = pd.read_csv('train_dataset.csv')
test_data = pd.read_csv('test_dataset.csv')
li=train_data.columns.to_list()[2::]
goal=['Tdewpoint', 'Visibility', 'Windspeed', 'RH_out', 'Press_mm_hg', 'RH_9', 'T_out', 'RH_4']
feature=list(set(li)-set(goal))

# 分离特征变量和目标变量
X = train_data[feature]
y = train_data[goal]

# 划分训练集和验证集
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)

# 构建随机森林模型
rf = RandomForestRegressor(n_estimators=100, random_state=42)

# 训练模型
rf.fit(X_train, y_train)

# 预测验证集的结果
y_pred_val = rf.predict(X_val)

# 计算验证集的均方误差
mse = mean_squared_error(y_val, y_pred_val)
print("Validation set MSE: {:.2f}".format(mse))

# 预测测试集的结果
y_pred_test = rf.predict(test_data)

# 保存预测结果到CSV文件
pd.DataFrame(y_pred_test).to_csv('test_result.csv', index=False)

posted @ 2023-05-27 13:39 打铁老鱼阅读(43) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 回归树（数据思维赛-家电能源预测）

· 神经网络（数据思维赛-家电能源预测）

· 随机森林—回归

· R ：随机森林（测试版2）

· 用随机森林做分类

2025年3月

日

一

二

三

四

五

六

打铁老鱼

世上安得两全法，不负如来不负卿

随机森林（数据思维赛-家电能源预测）

搜索

常用链接

随笔分类

随笔档案

文章分类

阅读排行榜