欢迎来到RankFan的Blogs

扩大
缩小

sklearn

安装:

pip install scikit-learn

sklearn 是一个非常强大的库,他也有很多做聚类的api,10种聚类算法的完整python操作示例 ; DBSCAN 在图分析中也看到过多次。


## 画出决策树
from graphviz import Source
from sklearn.tree import export_graphviz
    
PROJECT_ROOT_DIR = "."
CHAPTER_ID = "decision_trees"
# 当前路径下新建文件夹‘images’,文件夹里再新建文件夹(章节ID),整体作为图像路径
IMAGES_PATH = os.path.join(PROJECT_ROOT_DIR, "images", CHAPTER_ID)
os.makedirs(IMAGES_PATH, exist_ok=True) # makedir
    
export_graphviz(
        DT_model_fit, # 方法
        out_file=os.path.join(IMAGES_PATH, "Credit_tree.dot"), # 输出决策树文档,为制图做准备
        feature_names=var_all,
        class_names=['Bad_credit','Good_credit'],
        rounded=True,
        filled=True
    )
Source.from_file(os.path.join(IMAGES_PATH, "Credit_tree.dot"))

一些应用

Sklearn如何批量自动处理数据,Automated Data Cleaning with Python, 帖子中有多重方式填充缺失值,linear reg, knn, mean等Github link: AutoClean

调参

一般来说,包括网格调参和随机调参,网格调参可以参考:XGBoost---Sklearn_GridSearchCv


如果需要使用KFold 交叉验证:可以参考 sklearn KFold()
这里的图很清楚sklearn中混淆矩阵(confusion_matrix函数)的理解与使用
python sklearn 使用 LGBlgb 多分类设置

特征筛选 chi2
特征工程(三)特征组合与交叉(一)多项式特征

posted on 2021-10-18 08:50  RankFan  阅读(117)  评论(0编辑  收藏  举报

导航