编程语言 - 随笔分类(第2页) - lvdongjie-avatarx

DBSCANE API

摘要：https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html?highlight=dbsc#sklearn.cluster.DBSCAN 阅读全文

posted @ 2021-01-19 21:46 lvdongjie-avatarx 阅读(83) 评论(0) 推荐(0) 编辑

凝聚聚类API

摘要：https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html?highlight=agg#sklearn.cluster.AgglomerativeClustering h 阅读全文

posted @ 2021-01-19 19:47 lvdongjie-avatarx 阅读(43) 评论(0) 推荐(0) 编辑

sklearn- kmeans API

摘要：https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html?highlight=kmeans#sklearn.cluster.KMeans https://scikit-learn.org/stable/ 阅读全文

posted @ 2021-01-19 08:19 lvdongjie-avatarx 阅读(154) 评论(0) 推荐(0) 编辑

机器学习-集成学习-Boosting-XgBoost提升算法之LightGBM

摘要：LigthGBM是boosting集合模型中的新进成员，由微软提供，它和XGBoost一样是对GBDT的高效实现，原理上它和GBDT及XGBoost类似，都采用损失函数的负梯度作为当前决策树的残差近似值，去拟合新的决策树。 LightGBM在很多方面会比XGBoost表现的更为优秀。它有以下优势：阅读全文

posted @ 2021-01-17 22:31 lvdongjie-avatarx 阅读(583) 评论(0) 推荐(0) 编辑

集成学习-BaggingClassifier，BaggingRegressor

摘要：https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.BaggingClassifier.html?highlight=bagging#sklearn.ensemble.BaggingClassifier https:/ 阅读全文

posted @ 2021-01-14 08:18 lvdongjie-avatarx 阅读(362) 评论(0) 推荐(0) 编辑

集成学习-AdaBoostClassifier，AdaBoostRegressor

摘要：https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html?highlight=adaboost#sklearn.ensemble.AdaBoostClassifier http 阅读全文

posted @ 2021-01-14 08:17 lvdongjie-avatarx 阅读(438) 评论(0) 推荐(0) 编辑

机器学习-集成学习-boosting之AdaBoost算法详解

摘要：1. 概述 1.1 集成学习目前存在各种各样的机器学习算法，例如SVM、决策树、感知机等等。但是实际应用中，或者说在打比赛时，成绩较好的队伍几乎都用了集成学习(ensemble learning)的方法。集成学习的思想，简单来讲，就是“三个臭皮匠顶个诸葛亮”。集成学习通过结合多个学习器(例如同种算阅读全文

posted @ 2021-01-14 08:14 lvdongjie-avatarx 阅读(338) 评论(0) 推荐(0) 编辑

sklearn 缺失值处理器： Imputer

摘要：class sklearn.preprocessing.Imputer(missing_values=’NaN’, strategy=’mean’, axis=0, verbose=0, copy=True) 参数： missing_values: integer or “NaN”, optiona 阅读全文

posted @ 2021-01-13 19:34 lvdongjie-avatarx 阅读(1238) 评论(0) 推荐(1) 编辑

机器学习-随机森林算法及其实现（Random Forest）

摘要：https://blog.csdn.net/yangyin007/article/details/82385967 1 什么是随机森林？作为新兴起的、高度灵活的一种机器学习算法，随机森林（Random Forest，简称RF）拥有广泛的应用前景，从市场营销到医疗保健保险，既可以用来做市场营销模拟的阅读全文

posted @ 2021-01-13 08:43 lvdongjie-avatarx 阅读(2587) 评论(0) 推荐(0) 编辑

sklearn API 参考

摘要：https://scikit-learn.org/stable/modules/classes.html 阅读全文

posted @ 2021-01-13 08:04 lvdongjie-avatarx 阅读(56) 评论(0) 推荐(0) 编辑

Windows下安装Graphviz和pygraphviz的方法

摘要：1.安装Graphviz 在graphviz的官网(网址：http://www.graphviz.org/Download_windows.php)，选择Windows对应的mis文件进行下载。如graphviz-2.3.8.msi: 下载之后，进行安装。找到安装路径，如：C:\Program Fi 阅读全文

posted @ 2021-01-12 22:17 lvdongjie-avatarx 阅读(678) 评论(0) 推荐(0) 编辑

决策树的可视化

摘要：前面的博客里有提到决策树，我们也了解了决策树的构建过程，如果可以可视化决策树，把决策树打印出来，对我们理解决策树的构建会有很大的帮助。这篇文章中，我们就来看下如何可视化输出一棵决策树。一、安装相应的插件我们需要安装Graphviz和pygraphviz，教程，这个教程里有详细的安装过程，这里就不阅读全文

posted @ 2021-01-12 22:15 lvdongjie-avatarx 阅读(609) 评论(0) 推荐(0) 编辑

数据挖掘中对Categorical特征的处理

摘要：Categorical特征常被称为离散特征、分类特征，数据类型通常是object类型，而我们的机器学习模型通常只能处理数值数据，所以需要对Categorical数据转换成Numeric特征。 Categorical特征又有两类，我们需要理解它们的具体含义并进行对应的转换。 Ordinal 类型：这种阅读全文

posted @ 2021-01-12 19:48 lvdongjie-avatarx 阅读(434) 评论(0) 推荐(0) 编辑

python LabelEncoder与Get_Dummies的区别

摘要：1. pd.get_dummies() #简单&粗暴 pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=N 阅读全文

posted @ 2021-01-12 19:26 lvdongjie-avatarx 阅读(340) 评论(0) 推荐(0) 编辑

基于网格搜索的交叉验证 sklearn-GridSearchCV,CV调节超参

摘要：GridSearchCV 简介： GridSearchCV，它存在的意义就是自动调参，只要把参数输进去，就能给出最优化的结果和参数。但是这个方法适合于小数据集，一旦数据的量级上去了，很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快速调优的方法——坐标下降。它其实是一种贪心算阅读全文

posted @ 2021-01-10 18:42 lvdongjie-avatarx 阅读(526) 评论(0) 推荐(0) 编辑

sklearn中的Pipeline

摘要：Pipeline可以将许多算法模型串联起来，比如将特征提取、归一化、分类组织在一起形成一个典型的机器学习问题工作流。主要带来两点好处：直接调用fit和predict方法来对pipeline中的所有算法模型进行训练和预测。可以结合grid search对参数进行选择。在下面的例子中，我们使用决策阅读全文

posted @ 2021-01-10 10:59 lvdongjie-avatarx 阅读(182) 评论(0) 推荐(0) 编辑

Pandas Apply函数

摘要：Series.apply Series.apply(func, convert_dtype=True, args=(), **kwds) 对序列的每一个元素作用传入的函数参数参数描述 func : function 所要应用的函数 convert_dtype : boolean, default 阅读全文

posted @ 2021-01-10 10:47 lvdongjie-avatarx 阅读(146) 评论(0) 推荐(0) 编辑

python 创建新的env环境

摘要：conda create -n env-name python=3.8 阅读全文

posted @ 2020-10-18 13:56 lvdongjie-avatarx 阅读(701) 评论(0) 推荐(0) 编辑

lvdongjie-avatarx

此博客专攻人工智能。

随笔分类 - 编程语言

公告