随笔 - 384  文章 - 0  评论 - 35  阅读 - 142万

sklearn.feature_selection.VarianceThreshold 方差阈值法(过滤法的一种)

sklearn.feature_selection.VarianceThreshold 方差阈值法,用于特征选择,过滤器法的一种,去掉那些方差没有达到阈值的特征。默认情况下,删除零方差的特征

函数用法:

class sklearn.feature_selection.VarianceThreshold(threshold=0.0)

参数:

thresholdfloat,阈值,训练集方差低于此阈值的要素将被删除。默认设置是使所有要素的方差均非零,即删除所有样本中具有相同值的要素

属性:

variances_:array, shape (n_features,)即是每个特征的方差是多少,返回的是数组

复制代码
from sklearn.feature_selection import VarianceThreshold      
X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
selector = VarianceThreshold()
selector.fit_transform(X)
'''
array([[2, 0],
       [1, 4],
       [1, 1]])
'''
selector.variances_
#array([0.        , 0.22222222, 2.88888889, 0.        ])
复制代码

方法:

  1. fit(X [,y])适合SelectFromModel元变压器。
  2. fit_transform(X [,y])适合数据,然后对其进行转换。
  3. get_params([deep])获取此估计量的参数。
  4. get_support([index])获取所选特征的掩码或整数索引
  5. inverse_transform(X)反向转换操作
  6. partial_fit(X [,y])仅将SelectFromModel元变压器安装一次。
  7. set_params(**参数)设置此估算器的参数。
  8. transform(X)将X缩小为选定的特征。

 

posted on   小小喽啰  阅读(5188)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示