01 2018 档案

摘要:shutil是对OS中文件操作的补充:移动、复制、打包、压缩、解压。 1.copy文件内容到另一个文件,可以copy指定大小的内容。 shutil.copyfileobj(fsrc, fdst[, length=16*1024]) # 注意!fsrc, fdst都是文件对象,需要打开后才能进行复制 阅读全文
posted @ 2018-01-19 10:51 做梦当财神 阅读(1035) 评论(0) 推荐(0) 编辑
摘要:1.渗透理论是研究随机环境中聚簇现象的理论。 渗透现象刚好出现的概率是临界概率,记做pc。当每条边开通的概率大于pc时,渗透就会出现,开通的概率小于pc,渗透不会出现。 人们在随机图理论的研究中发现节点存在节点集群的临界概率,即网络具有临界概率pc,当不超过pc时,网络由孤立的节点集群组成,当超过p 阅读全文
posted @ 2018-01-17 22:46 做梦当财神 阅读(1648) 评论(0) 推荐(0) 编辑
摘要:学习曲线函数: from sklearn.learning_curve import learning_curve 调用格式: learning_curve(estimator, X, y, train_sizes=array([0.1, 0.325, 0.55, 0.775, 1. ]), cv= 阅读全文
posted @ 2018-01-12 13:57 做梦当财神 阅读(2642) 评论(0) 推荐(0) 编辑
摘要:numpy,sklearn提供随机数据生成功能,我们可以自己生成适合某一种模型的数据,用随机数据来清洗,归一化,转换,然后选择模型与算法做拟合和预测。 1.numpy随机数据生成API numpy比较适合用来生产一些简单的抽样数据。API都在random类中,常见的API有: (1).rand(d0 阅读全文
posted @ 2018-01-09 20:30 做梦当财神 阅读(612) 评论(0) 推荐(0) 编辑
摘要:from sklearn.model_selection import train_test_split train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取train data和test data。 语法: X_train,X_test, y_train, y_t 阅读全文
posted @ 2018-01-05 14:40 做梦当财神 阅读(14351) 评论(0) 推荐(0) 编辑
摘要:cross_val_score 实例 交叉检验(cross validation)是一种常用的模型选择方法。 如果给你的样本数据充足,模型选择的一种简单方法是将随机数据切分为训练集(training set)、验证集(validation set)、测试集(\(test 阅读全文
posted @ 2018-01-05 14:17 做梦当财神 阅读(2908) 评论(0) 推荐(0) 编辑
摘要:在 梯度提升树(GBDT) 中,对 GBDT 原理做了总结。本文对 sklearnGBDT 的调参做一个总结。 1. sklearn 中 GBDT 的概述 在 sklearn 中,GradientBoostingClassifier 用于分类,GradientB 阅读全文
posted @ 2018-01-04 17:26 做梦当财神 阅读(8325) 评论(0) 推荐(2) 编辑
摘要:官网:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html class sklearn.linear_model.LinearRegression(fit_interce 阅读全文
posted @ 2018-01-02 22:51 做梦当财神 阅读(1141) 评论(0) 推荐(0) 编辑
摘要:sklearn.datasets官网:http://scikit-learn.org/stable/datasets/ sklearn.datasets 模块主要提供一些导入、在线下载及本地生成数据集的方法,可以通过 dir 或 help 命令查看,会发现主要有三种形式:load_<dataset_ 阅读全文
posted @ 2018-01-02 16:58 做梦当财神 阅读(5418) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示