sklearn中的弹性网函数 ElasticNet
语法:
ElasticNet(self, alpha=1.0, l1_ratio=0.5, fit_intercept=True, normalize=False, precompute=False, max_iter=1000, copy_X=True, tol=1e-4, warm_start=False, positive=False, random_state=None, selection=’cyclic’)
类型:
sklearn.linear_model.coordinate_descent 中的类,使用L1和L2组合作为正则项的线性回归。最小化目标函数为
1(2∗nsamples)||y−Xw||22+α∗l1_ratio∗||w||1+0.5∗ alpha∗(1−l1_ratio)∗||w||221(2∗nsamples)||y−Xw||22+α∗l1_ratio∗||w||1+0.5∗ alpha∗(1−l1_ratio)∗||w||22
如果关注L1和L2惩罚项的分类,记住下面的公式:
a=L1+b∗L2a=L1+b∗L2
这里:
α=a+bl1_ratio=a/(a+b)α=a+bl1_ratio=a/(a+b)
这里参数l1_ratio对用R中的glmnet包中的αα ,αα 对用R中的λλ ,特别的,l1_ratio = 1 是lasso惩罚,当前l1_ratio≤0.01l1_ratio≤0.01 是不可靠的,除非你使用自己定义的alpha序列。
在用户指南中读取更多。
输入参数:
- 参数名:alpha
- 类型:float, optional
- 说明:混合惩罚项的常数,morning是1,看笔记的得到有关这个参数的精确数学定义。alpha = 0等价于传统最小二乘回归,通过LinearRegression求解。因为数学原因,使用alpha = 0的lasso回归时不推荐的,如果是这样,你应该使用 LinearRegression 。*
- 参数名:l1_ratio
- 类型:float
- 说明:弹性网混合参数,0 <= l1_ratio <= 1,对于 l1_ratio = 0,惩罚项是L2正则惩罚。对于 l1_ratio = 1是L1正则惩罚。对于 0
属性
- 参数名:coef_
- 类型:array, shape (n_features,) | (n_targets, n_features)
- 说明:参数向量(损失函数表达式中的ww )
- 参数名:sparse_coef_
- 类型:scipy.sparse matrix, shape (n_features, 1) | (n_targets, n_features)
- 说明:sparse_coef_ 是从coef_ 导出的只读属性
- 参数名:intercept_
- 类型:float | array, shape (n_targets,)
- 说明:决策函数中的独立项,即截距
- 参数名:n_iter_
- 类型:array-like, shape (n_targets,)
- 说明:由坐标下降求解器运行的,达到指定公差的迭代次数。
实例:
#导入弹性网
from sklearn.linear_model import ElasticNet
from sklearn.datasets import make_regression
# 初始化数据,模拟数据
X, y = make_regression(n_features=2, random_state=0)
# 实例化弹性网类,设定随机种子,保证每次计算结果都相同
regr = ElasticNet(random_state=0)
# 训练弹性网
regr.fit(X, y)
# 打印系数,结果是[ 18.83816048 64.55968825]
print(regr.coef_)
# 打印截距,结果是1.45126075617
print(regr.intercept_)
# 打印预测值,结果是[ 1.45126076]
print(regr.predict([[0, 0]]))
为了避免不必要的内存复制,应该将fit方法的X参数直接作为一个fortranguous numpy数组传递
参阅
- SGDRegressor:采用增量式培训实现弹性净回归。
- SGDClassifier:用弹性网惩罚实现逻辑回归。
- (SGDClassifier(loss=”log”, penalty=”elasticnet”)).