多元线性回归

当变量中有分类型的变量的时候,需要将分类型的变量转换成数值型的变量。
例如:
比如某衣服有一个颜色特征,特征值为红、绿、蓝三种颜色,该特征为分类型特征,需要把它转化成数值型特征,则把这个衣服颜色需要分为三个特征,分别是红色、绿色、蓝色,则红色衣服对应的特征值为1,0,0;绿色衣服对应的特征值为0,1,0;蓝色衣服对应的特征值为0,0,1。

代码
简单例子

from numpy import genfromtxt
import numpy as np
from sklearn import datasets,linear_model

dataPath = r"D:\csv_file\Delivery.csv"
deliveryData = genfromtxt(dataPath, delimiter = ",")#csv文件分割成数组

print("deliveryData:")
print(deliveryData)

X = deliveryData[:,0:-1]
Y = deliveryData[:,-1]

print("X:")
print(X)
print("Y:")
print(Y)

regr = linear_model.LinearRegression()
regr.fit(X, Y)
print("coefficients:")
print(regr.coef_)#斜率
print("intercept:")
print(regr.intercept_)#截距

xPred = [[102,6]]
yPred = regr.predict(xPred)
print("predicted y:")
print(yPred)
---------------------

posted @ 2019-06-25 12:52  水至清明  阅读(269)  评论(0编辑  收藏  举报