2018年1月27日

机器学习中的训练集、验证集和测试集

摘要: 在有监督(supervise)的机器学习中,数据集一般被分成2~3个,即:训练集(train set) 、验证集(validation set) 测试集(test set)。 三个集合的定义为: Training set:A set of examples used for learning, wh 阅读全文

posted @ 2018-01-27 17:10 CuriousZero 阅读(5847) 评论(0) 推荐(0) 编辑

机器学习性能度量指标:AUC

摘要: 在IJCAI 于2015年举办的竞赛:Repeat Buyers Prediction Competition 中, 很多参赛队伍在最终的Slides展示中都表示使用了 AUC 作为评估指标: 那么,AUC是什么呢? AUC是一个机器学习性能度量指标,只能用于二分类模型的评价。(拓展二分类模型的其他 阅读全文

posted @ 2018-01-27 15:38 CuriousZero 阅读(3092) 评论(0) 推荐(0) 编辑

Python 的 if __name__ == '__main__'

摘要: Python 文件 最后部分会有: 1)首先,这是一个判断语句。 2)其次,__name__是模块的属性 __name__ 指代当前模块名,当模块被直接运行时模块名为 __main__ 。 一个模块被另一个程序第一次引入时,其主程序将运行。如果想在模块被引入时,模块中的某一程序块不执行,可以用__n 阅读全文

posted @ 2018-01-27 15:10 CuriousZero 阅读(181) 评论(0) 推荐(0) 编辑

《Python数据分析》-Ch01 Python 程序库入门

摘要: Ch01 Python 程序库入门 1.1 一些简要介绍: 1.2 NumPy数组: 与Python中的列表相比,进行数值运算时 NumPy数组的效率要高得多。事实上,NumPy 数组是针对某些对象进行了大量的优化工作。完成相同的运算时,NumPy代码与Python代码相比用到的显式循环语句明显要少 阅读全文

posted @ 2018-01-27 14:59 CuriousZero 阅读(278) 评论(0) 推荐(0) 编辑

导航