LinearDiscriminantAnalysis参数、属性和方法
【LDA】线性判别分析
参数:
solver:一个字符串,指定了求解最优化问题的算法,可以为如下的值。
- 'svd':奇异值分解。对于有大规模特征的数据,推荐用这种算法。
- 'lsqr':最小平方差,可以结合skrinkage参数。
- 'eigen' :特征分解算法,可以结合shrinkage参数。
skrinkage:字符串‘auto’或者浮点数活者None。该参数通常在训练样本数量小于特征数量的场合下使用。该参数只有在solver=lsqr或者eigen下才有意义
- '字符串‘auto’:根据Ledoit-Wolf引理来自动决定shrinkage参数的大小。
- 'None:不使用shrinkage参数。
- 浮点数(位于0~1之间):指定shrinkage参数。
priors:一个数组,数组中的元素依次指定了每个类别的先验概率。如果为None,则认为每个类的先验概率都是等可能的。
n_components:一个整数。指定了数组降维后的维度(该值必须小于n_classes-1)。
store_covariance:一个布尔值。如果为True,则需要额外计算每个类别的协方差矩阵。
warm_start:一个布尔值。如果为True,那么使用前一次训练结果继续训练,否则从头开始训练。
tol:一个浮点数。它指定了用于SVD算法中评判迭代收敛的阈值。
返回值
coef_:权重向量。
intercept:b值。
covariance_:一个数组,依次给出了每个类别烦人协方差矩阵。
means_:一个数组,依次给出了每个类别的均值向量。
xbar_:给出了整体样本的均值向量。
n_iter_:实际迭代次数。
方法
fix(X,y):训练模型。
predict(X):用模型进行预测,返回预测值。
score(X,y[,sample_weight]):返回(X,y)上的预测准确率(accuracy)。
predict_log_proba(X):返回一个数组,数组的元素一次是 X 预测为各个类别的概率的对数值。
predict_proba(X):返回一个数组,数组元素一次是 X 预测为各个类别的概率的概率值
predict_proba(X):返回一个数组,数组元素一次是 X 预测为各个类别的概率的概率值