【保险案例的应用】
1.线性预测的方式在实际应用中使用的很少
基于线性回归的分类算法-->逻辑回归,softman回归(非常好用)
2.更多的是基于梯度决策树去做预测(效果好)

import pandas as pd import numpy as np from sklearn.preprocessing import PolynomialFeatures from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt """ 1.线性预测的方式在实际应用中使用的很少 基于线性回归的分类算法-->逻辑回归,softman回归(非常好用) 2.更多的是基于梯度决策树去做预测(效果好) """ with open(r'F:\数据分析专用\数据分析与机器学习\insurance.csv',) as f: data = pd.read_csv(f) # print(data.describe()) # print(data.head()) data_count = data['age'].value_counts() # print(data_count) # data_count[: 10].plot(kind='bar') # plt.show() # 列之间的相关性 # print(data.corr()) reg = LinearRegression() x = data[['age', 'sex', 'bmi', 'children', 'smoker', 'region']] y = data['charges'] x = x.apply(pd.to_numeric, errors='coerce') y = y.apply(pd.to_numeric, errors='coerce') x.fillna(0, inplace=True) y.fillna(0, inplace=True) poly_fe = PolynomialFeatures(degree=3, include_bias=False) # print(x) # print(y) X_poly = poly_fe.fit_transform(x) reg.fit(X_poly, y) # print(reg.coef_) # print(reg.intercept_) y_pre = reg.predict(X_poly) plt.plot(x['age'], y, 'b.') plt.plot(X_poly[:, 0], y_pre, 'r.') plt.show()
PS
1.什么是Person相关系数?
Person相关系数是用来测量两组数据是否是线性相关的,Person相关系数的区间范围是【-1,1】,如果越接近-1,说明两组变量负相关,一个变大另一个变小
反之越接近于1,说明两组变量正相关,越接近于0则两组变量之间没有相关性,通过Person相关系数可以判断出来数据的相关性,接近1的数据可以进行降维处理
如果发现结果和某个维度的数据相关系数接近0,可以去除该数据做到降维
Win a contest, win a challenge
posted on 2018-09-29 09:32 pandaboy1123 阅读(174) 评论(0) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南