01 2018 档案
摘要:shutil是对OS中文件操作的补充:移动、复制、打包、压缩、解压。 1.copy文件内容到另一个文件,可以copy指定大小的内容。 shutil.copyfileobj(fsrc, fdst[, length=16*1024]) # 注意!fsrc, fdst都是文件对象,需要打开后才能进行复制
阅读全文
摘要:1.渗透理论是研究随机环境中聚簇现象的理论。 渗透现象刚好出现的概率是临界概率,记做pc。当每条边开通的概率大于pc时,渗透就会出现,开通的概率小于pc,渗透不会出现。 人们在随机图理论的研究中发现节点存在节点集群的临界概率,即网络具有临界概率pc,当不超过pc时,网络由孤立的节点集群组成,当超过p
阅读全文
摘要:学习曲线函数: from sklearn.learning_curve import learning_curve 调用格式: learning_curve(estimator, X, y, train_sizes=array([0.1, 0.325, 0.55, 0.775, 1. ]), cv=
阅读全文
摘要:numpy,sklearn提供随机数据生成功能,我们可以自己生成适合某一种模型的数据,用随机数据来清洗,归一化,转换,然后选择模型与算法做拟合和预测。 1.numpy随机数据生成API numpy比较适合用来生产一些简单的抽样数据。API都在random类中,常见的API有: (1).rand(d0
阅读全文
摘要:from sklearn.model_selection import train_test_split train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取train data和test data。 语法: X_train,X_test, y_train, y_t
阅读全文
摘要:cross_val_score 实例 交叉检验()是一种常用的模型选择方法。 如果给你的样本数据充足,模型选择的一种简单方法是将随机数据切分为训练集()、验证集()、测试集(\(test
阅读全文
摘要:在 梯度提升树(GBDT) 中,对 原理做了总结。本文对 中 的调参做一个总结。 1. sklearn 中 GBDT 的概述 在 中,GradientBoostingClassifier 用于分类,GradientB
阅读全文
摘要:官网:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html class sklearn.linear_model.LinearRegression(fit_interce
阅读全文
摘要:sklearn.datasets官网:http://scikit-learn.org/stable/datasets/ sklearn.datasets 模块主要提供一些导入、在线下载及本地生成数据集的方法,可以通过 dir 或 help 命令查看,会发现主要有三种形式:load_<dataset_
阅读全文