02 2021 档案
摘要:#####作为机器学习实践中分类领域下的一个模块,多分类问题建模也是生产生活应用中的重要组成部分;在模型构建完成之后,对多分类模型的评估影响到后期的模型决策甚至是机器学习解决方案的实际应用效果。 准确有效评估多分类模型的性能,有利于我们建立起对当前模型水平的正确认识;由此,本文着重探讨几种常用的多分
阅读全文
摘要:#####在以linux为内核的操作系统环境中,文本编辑器 具有重要地位,其中关键原因在于涉及linux操作系统的配置均是以文件形式存在,因而维护linux的正常运行特别是自定义环境配置时,必须用到文本编辑器修改配置文件的内容。 作为编辑文件的主流编辑器,vim 一直在linux系统中被奉为神器,诚
阅读全文
摘要:#####前面提到,应用sklearn中的pipeline机制的高效性;本文重点讨论pipeline与网格搜索在机器学习实践中的结合运用: ##结合管道和网格搜索以调整预处理步骤以及模型参数 一般地,sklearn中经常用到网格搜索寻找应用模型的超参数;实际上,在训练数据被送入模型之前,对数据的预处
阅读全文
摘要:#####前期博文提到管道(pipeline)在机器学习实践中的重要性以及必要性,本文则递进一步,探讨实际操作中管道的创建与访问。 已经了解到,管道本质上是一定数量的估计器连接而成的数据处理流,所以成功创建管道的唯一要求就是:管道中所有估计器必须具有fit()和transform()方法,但管道中最
阅读全文
摘要:在使用sklean处理一个机器学习实例时,可能会经过数据缩放、特征合并以及模型学习拟合等过程;并且,当问题更为复杂时,所应用到的算法以及模型则较为繁杂。 与此同时,经过实践发现,在忽略一些细节的前提下,可以通过将这些数据处理步骤结合成一条算法链,以更加高效地完成整个机器学习流程;由此,管道(pipe
阅读全文
摘要:仿照上篇博文对于混淆矩阵、ROC和AUC指标的探讨,本文简要讨论机器学习二分类问题中的混淆矩阵、PR以及AP评估指标;实际上,(ROC,AUC)与(PR,AP)指标对具有某种相似性。 ####按照循序渐进的原则,依次讨论混淆矩阵、PR和AP: 设定一个机器学习问题情境:给定一些肿瘤患者样本,构建一个
阅读全文
摘要:本篇博文简要讨论机器学习二分类问题中的混淆矩阵、ROC以及AUC评估指标;作为评价模型的重要参考,三者在模型选择以及评估中起着指导性作用。 ####按照循序渐进的原则,依次讨论混淆矩阵、ROC和AUC: 设定一个机器学习问题情境:给定一些肿瘤患者样本,构建一个分类模型来预测肿瘤是良性还是恶性,显然这
阅读全文
摘要:在深度学习领域,Keras是一个高度封装的库并被广泛应用,可以通过调用其内置网络模块(各种网络层)实现针对性的模型结构;当所需要的网络层功能不被包含时,则需要通过自定义网络层或模型实现。 如何在keras框架下自定义层,基本“套路”如下。 ####一般地,keras中的网络层是一个类,所以自定义层即
阅读全文
摘要:Python中的装饰器是Python语言中的一个重要组成部分,属于python语法糖一大体现。 装饰器可以一言以蔽之: ####装饰器是修改其他函数的功能的函数,装饰器的作用就是为已经存在的对象添加额外的功能。 装饰器本质上是一个 Python 函数或类,它可以让其他函数或类在不需要做任何代码修改的
阅读全文
摘要:在python中,可迭代对象&迭代器&生成器的关系如下图: ####即:生成器是一种特殊的迭代器,迭代器是一种特殊的可迭代对象。 ###可迭代对象 如上图,这里x是一个列表(可迭代对象),其实正如第一张图所示,可迭代对象包含范围很广,如list是可迭代对象,dict是可迭代对象,set也是可迭代对象
阅读全文
摘要:linux是服务器应用领域的开源且免费的多用户多任务操作系统的内核。 以下是对上述论断的解释: ####操作系统 简言之,操作系统乃是所有计算设备的大管家,小到智能手表,大到航天航空设备,所有需要操控硬件的地方都会有操作系统的身影。以周遭的生活为例,日常使用的智能手机,主流的操作系统用的是谷歌公司的
阅读全文
摘要:语法糖 按照线上资料,编程语言的语法糖概念解释如下: 语法糖(Syntactic sugar),也译为糖衣语法,是由英国计算机科学家彼得·约翰·兰达(Peter J. Landin)发明的一个术语,指计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更方便程序员使用。通常来说使用语法糖
阅读全文