随笔分类 -  机器学习与数据挖掘

摘要:1、推荐算法的Python脚本文件(.py文件): ModelPredictAllLinux.py的Python脚本文件 import sysimport jiebaimport joblibimport operator#按照个数多少排序算法def SortList(merge_predict_i 阅读全文
posted @ 2022-01-12 16:18 The-Chosen-One 阅读(2797) 评论(1) 推荐(0) 编辑
摘要:最原始从官网下载: pip install tensorflow 从国内镜像网站安装最新版本: pip install tensorflow -i http://pypi.douban.com/simple/ 或者指定版本号: pip install tensorflow==1.14.0 -i ht 阅读全文
posted @ 2021-12-03 17:42 The-Chosen-One 阅读(2787) 评论(0) 推荐(0) 编辑
摘要:import numpy as np #导入数据结构nmupy模块import matplotlib.pyplot as plt #导入matplotlib图像输出模块plt.rcParams["font.sans-serif"]=["SimHei"] #输出图像的标题可以为中文正常输出plt.rc 阅读全文
posted @ 2020-08-08 17:32 The-Chosen-One 阅读(823) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2020-07-31 15:20 The-Chosen-One 阅读(0) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2020-07-31 15:18 The-Chosen-One 阅读(0) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2020-07-30 16:28 The-Chosen-One 阅读(0) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2020-07-30 15:54 The-Chosen-One 阅读(0) 评论(0) 推荐(0) 编辑
摘要:#支持向量机算法原理及实现#(一)sklearn中利用SVM算法解决分类问题import numpy as npimport matplotlib.pyplot as plt#1-1 多算法融合思想的使用——KNN算法参数寻优from sklearn.feature_selection import 阅读全文
posted @ 2020-07-30 15:18 The-Chosen-One 阅读(428) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2020-07-24 20:35 The-Chosen-One 阅读(5) 评论(0) 推荐(0) 编辑
摘要:KFold分成不同的份数进行模型的平均表现输出即可#1-1KFold交叉验证方式from sklearn.datasets import load_irisfrom sklearn.feature_selection import SelectKBest,f_classiffrom sklearn. 阅读全文
posted @ 2020-05-27 18:53 The-Chosen-One 阅读(1089) 评论(0) 推荐(0) 编辑
摘要:XGboost数据比赛实战之调参篇(完整流程) 首先,很幸运的是,Scikit-learn中提供了一个函数可以帮助我们更好地进行调参: sklearn.model_selection.GridSearchCV 常用参数解读: estimator:所使用的分类器,如果比赛中使用的是XGBoost的话, 阅读全文
posted @ 2020-05-27 18:51 The-Chosen-One 阅读(708) 评论(0) 推荐(0) 编辑
摘要:单变量特征选择 单变量特征选择是通过选择那些基于单变量统计检验(univariate statistical tests)得出的最优特征来实现的。它可以看作是估计器的一个预处理步骤。Scikit-learn将一系列特征选择程序作为不同的类提供给我们,这些类都实现了 transform 方法: Sel 阅读全文
posted @ 2020-05-27 18:17 The-Chosen-One 阅读(823) 评论(0) 推荐(0) 编辑
摘要:#机器学习项目实战1-泰坦尼克号获救预测#1-1数据导入pandas库import pandas as pdpd.set_option("max_columns",1000) #设置最大展示列的数目为1000pd.set_option("max_rows",1000) #设置最大展示行的数目为100 阅读全文
posted @ 2020-05-27 17:36 The-Chosen-One 阅读(767) 评论(0) 推荐(0) 编辑
摘要:#1-1二维数据表格文件的读入操作df=pd.read_excel(r"D:\Byrbt2018\Study\Python数据分析技术基础课程+练习+讲解\Python数据分析课程+练习+讲解\作业\作业3\作业3\香港酒店数据.xlsx") #r表示默认不是转义字符print(df)print(d 阅读全文
posted @ 2020-04-23 10:15 The-Chosen-One 阅读(1884) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-03-29 10:34 The-Chosen-One 阅读(449) 评论(0) 推荐(0) 编辑
摘要:#机器学习模型选择与参数调优#三种集成学习算法-GBDT/XGBoost/lightGBM#1-1 GBDT算法:梯度决策树,加强型模型,构建多个决策树进行合并import numpy as npimport matplotlib.pyplot as pltfrom sklearn import e 阅读全文
posted @ 2020-03-29 10:31 The-Chosen-One 阅读(2705) 评论(0) 推荐(0) 编辑
摘要:#特征工程#1-1sklearn中进行特征选择#筛选法-方差筛选过滤import numpy as npimport arrayfrom sklearn.feature_selection import VarianceThresholdx=[[0,0,1],[0,1,0],[1,0,0],[0,1 阅读全文
posted @ 2020-03-29 10:28 The-Chosen-One 阅读(566) 评论(0) 推荐(0) 编辑
摘要:#数据可视化分析#python中matplotlib绘制图像'''import matplotlib.pyplot as pltimport matplotlib as mplimport numpy as npimport warningswarnings.filterwarnings("igno 阅读全文
posted @ 2020-03-25 20:06 The-Chosen-One 阅读(994) 评论(0) 推荐(0) 编辑
摘要:#python数据清洗操作#1-1 pandas进行数据缺失值的预处理import pandas as pdimport numpy as npdate=pd.date_range("20200101",periods=6)df=pd.DataFrame(np.random.randn(6,4),i 阅读全文
posted @ 2020-03-25 20:05 The-Chosen-One 阅读(650) 评论(0) 推荐(0) 编辑
摘要:#python爬虫技术#1-1 需要通过python的urllib或者request建立请求通信机制#1导入python的url库,请求库,用于与网页进行通信请求'''from urllib.request import urlopenurl="https://www.python.org/"res 阅读全文
posted @ 2020-03-25 20:04 The-Chosen-One 阅读(675) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示