Fork me on GitHub

01 2018 档案

摘要:模型后处理 作者:Trent Hauck 译者:飞龙 协议:CC BY-NC-SA 4.0 5.1 K-fold 交叉验证 这个秘籍中,我们会创建交叉验证,它可能是最重要的模型后处理验证练习。我们会在这个秘籍中讨论 k-fold 交叉验证。有几种交叉验证的种类,每个都有不同的随机化模式。K-fold 阅读全文
posted @ 2018-01-30 23:37 stardsd 阅读(1285) 评论(0) 推荐(0) 编辑
摘要:preface:做实验少不了交叉验证,平时常用from sklearn.cross_validation import train_test_split,用train_test_split()函数将数据集分为训练集和测试集,但这样还不够。当需要调试参数的时候便要用到K-fold。scikit给我们提 阅读全文
posted @ 2018-01-30 23:37 stardsd 阅读(784) 评论(0) 推荐(0) 编辑
摘要:本文结构: 什么是交叉验证法? 为什么用交叉验证法? 主要有哪些方法?优缺点? 各方法应用举例? 什么是交叉验证法? 它的基本思想就是将原始数据(dataset)进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。 为什么用交叉验证法? 交叉验证用于评估模型的预测性能,尤其是训练好的 阅读全文
posted @ 2018-01-29 20:54 stardsd 阅读(11416) 评论(0) 推荐(0) 编辑
摘要:比方说,用100k条数据,有两个思路 1. 用这100k条数据做k-fold交叉验证,来调模型参数 2. 先随机划分出70k条数据做训练集用来根据交叉验证调参数,调好之后再用剩下的30k条数据做测试集 【答】 虽然这两个都没有错对之分,但是在数据量允许的情况下,更建议第2个思路。 对于思路1,如果用 阅读全文
posted @ 2018-01-29 16:48 stardsd 阅读(7978) 评论(2) 推荐(1) 编辑
摘要:ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,对两者的简单介绍见这里。这篇博文简单介绍ROC和AUC的特点,以及更为深入地,讨论如何作出ROC曲线图以及计算AUC。 ROC曲线 需要提前 阅读全文
posted @ 2018-01-26 16:10 stardsd 阅读(10753) 评论(0) 推荐(0) 编辑
摘要:python中的深拷贝和浅拷贝和java里面的概念是一样的,所谓浅拷贝就是对引用的拷贝,所谓深拷贝就是对对象的资源的拷贝。首先,对赋值操作我们要有以下认识: 赋值是将一个对象的地址赋值给一个变量,让变量指向该地址( 旧瓶装旧酒 )。 修改不可变对象(str、tuple)需要开辟新的空间 修改可变对象 阅读全文
posted @ 2018-01-24 20:47 stardsd 阅读(418) 评论(0) 推荐(0) 编辑
摘要:什么是关键意见领袖 在营销学上,为各厂家宣传的专家或权威被称为“关键意见领袖(Key Opinion Leader),通常被定义为:拥有更多、更准确的产品信息,且为相关群体所接受或信任,并对该群体的购买行为有较大影响力的人。他们一般具备三大特征: 关键意见领袖的特征 第一是持久介入特征:KOL对某类 阅读全文
posted @ 2018-01-18 23:37 stardsd 阅读(2557) 评论(0) 推荐(0) 编辑
摘要:一环境说明 二centos在vmware中的安装 三NAT网络设置 四设置固定IP 1修改网卡配置说明 2修改etcresolvconf 实现域名解析 五设置防火墙iptables 1 centos安装telnet 2 防火墙iptables设置 六 总结 前言:由于工作中需要使用Linux,在虚拟 阅读全文
posted @ 2018-01-12 19:25 stardsd 阅读(964) 评论(0) 推荐(0) 编辑