10种常见的回归算法总结和介绍

线性回归是机器学习中最简单的算法,它可以通过不同的方式进行训练。 在本文中,我们将介绍以下回归算法:线性回归、Robust 回归、Ridge 回归、LASSO 回归、Elastic Net、多项式回归、多层感知机、随机森林回归和支持向量机。除此以外,本文还将介绍用于评估回归模型的最常用指标,包括均方误差 (MSE)、均方根误差 (RMSE) 和平均绝对误差 (MAE)。

导入库和读取数据

  1. import pandas as pd
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. import seaborn as sns
  5. import hvplot.pandas
  6. %matplotlib inline
  7. sns.set_style("whitegrid")
  8. plt.style.use("fivethirtyeight")
  9. USAhousing = pd.read_csv('../usa-housing/USA_Housing.csv')
  10. USAhousing.head()

探索性数据分析 (EDA)

下一步将创建一些简单的图表来检查数据。 进行EDA将帮助我们熟悉数据和获得数据的信息,尤其是对回归模型影响最大的异常值。

  1. USAhousing.info()
  2. <class 'pandas.core.frame.DataFrame'>
  3. RangeIndex: 5000 entries, 0 to 4999
  4. Data columns (total 7 columns):
  5. # Column Non-Null Count Dtype
  6. --- ------ -------------- -----
  7. 0 Avg. Area Income 5000 non-null float64
  8. 1 Avg. Area House Age 5000 non-null float64
  9. 2 Avg. Area Number of Rooms 5000 non-null float64
  10. 3 Avg. Area Number of Bedrooms 5000 non-null float64
  11. 4 Area Population 5000 non-null float64
  12. 5 Price 5000 non-null float64
  13. 6 Address 5000 non-null object
  14. dtypes: float64(6), object(1)
  15. memory usage: 273.6+ KB

查看数据集的描述

 

完整文章:

https://avoid.overfit.cn/post/80b712f97fce48418be96916262f9f81

posted @   deephub  阅读(406)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示