12 2019 档案
摘要:模型训练好之后,我们就要想办法将其持久化保存下来,不然关机或者程序退出后模型就不复存在了。本文介绍两种持久化保存模型的方法。
阅读全文
摘要:预处理操作是机器学习整个周期中必不可少的一个过程,也是最能快速改善模型性能的一个过程,往往稍微转换一下特征属性的形态,就能得到性能的极大提升。当然,数据预处理绝对也是耗时最长的一个过程,这一过程不仅要求洞悉整个数据集结构分布,还要探查每一个特征属性细节情况,并作出应对处理,使数据以最适合的状态传输给模型。
针对预处理操作,sklearn中提供了许多模块工具,灵活使用工具可以让数据预处理轻松很多。
本文简要介绍数据预处理中的一些主要方法,并结合sklearn中提供的模块进行实践。
阅读全文
摘要:Keras是一个基于Python编写的高层神经网络API,凭借用户友好性、模块化以及易扩展等有点大受好评,考虑到Keras的优良特性以及它的受欢迎程度,TensorFlow2.0中将Keras的代码吸收了进来,化身为tf.keras模块供用户使用。使用tf.keras提供的高层API,可以轻松得完成建模三部曲——模型构建、训练、评估等工作。下面我们分别来说说如何使用tf.keras完成这三部曲。
阅读全文
摘要:SVM,Support Vector Machine,也就是我们中文名的支持向量机,我相信,只要是与机器学习有过照面的童鞋或多或少都听说过这个名字。作为机器学习家族中的老牌成员,其经典自不必说。从原理和特性上讲,SVM属于有监督学习中线性二分类中的一员,基本思想就是采用最大化间隔策略寻找一个最优决策超平面将所有样本点划分到平面两侧,实现对数据的分类。
阅读全文