摘要:
使用joblib模块保存于加载模型 在机器学习的过程中,我们会进行模型的训练,最常用的就是sklearn中的库,而对于训练好的模型,我们当然是要进行保存的,不然下次需要进行预测的时候就需要重新再进行训练。如果数据量小的话,那再重新进行训练是没有问题的,但是如果数据量大的话,再重新进行训练可能会花费很 阅读全文
摘要:
在现实收集的样本中,正负类别不均衡是现实数据中很常见的问题。一个分类器往往 Accuracy 将近90%,但是对少数样本的判别的 Recall 却只有10%左右。这对于我们正确找出少数类样本非常不利。 举例来说:在一波新手推荐的活动中,预测用户是否会注册的背景下,不注册的用户往往是居多的,这个正负比 阅读全文
摘要:
一、前言 刷题平台:牛客网 二、题目 输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6},则重建二叉树并返回。 1、思路 通常树有如下几 阅读全文
摘要:
一、前言 刷题平台:牛客网 二、题目 输入一个链表,返回一个反序的链表。 1、思路 通常,这种情况下,我们不希望修改原链表的结构。返回一个反序的链表,这就是经典的“后进先出”,我们可以使用栈实现这种顺序。每经过一个结点的时候,把该结点放到一个栈中。当遍历完整个链表后,再从栈顶开始逐个输出结点的值,给 阅读全文
摘要:
好记性不如烂笔头,打算以博客连载的方式把最近机器学习的一些学习笔记记下来,机器学习涉及的知识点很多,时间一长很容易遗忘,写在博客上也方便自己随时查阅及复习。学习笔记偏重实用工程,尽量不涉及复杂的数学推导。 机器学习分类 -- 监督学习:训练数据中带有标记(分类、回归); -- 无监督学习:训练数据中 阅读全文
摘要:
1)什么是链接? 链接是指两个设备之间的连接。它包括用于一个设备能够与另一个设备通信的电缆类型和协议。 2)OSI 参考模型的层次是什么? 有 7 个 OSI 层:物理层,数据链路层,网络层,传输层,会话层,表示层和应用层。 3)什么是骨干网? 骨干网络是集中的基础设施,旨在将不同的路由和数据分发到 阅读全文
摘要:
协方差用于表示变量间的相互关系,变量间的相互关系一般有三种:正相关,负相关和不相关。 正相关:假设有两个变量x和y,若x越大y越大;x越小y越小则x和y为正相关。 负相关:假设有两个变量x和y,若x越大y越小;x越小y越大则x和y为负相关。 不相关:假设有两个变量x和y,若x和y变化无关联则x和y为 阅读全文
摘要:
正态分布,又称高斯分布。其特征为中间高两边低左右对称。它有以下几个性质: 集中性:曲线的最高峰位于正中央,且位置为均数所在的位置。 对称性:正态分布曲线以均数所在的位置为中心左右对称且曲线两段无线趋近于横轴。 均匀变动性:正态分布曲线以均数所在的位置为中心均匀向左右两侧下降。 面积恒等:曲线与横轴间 阅读全文
摘要:
从多元正态分布中抽取随机样本。 多元正态分布,多正态分布或高斯分布是一维正态分布向更高维度的推广。这种分布由其均值和协方差矩阵来确定。这些参数类似于一维正态分布的平均值(平均值或“中心”)和方差(标准差或“宽度”,平方)。 np.random.multivariate_normal方法用于根据实际情 阅读全文
摘要:
这是 IPython 中定义的魔法函数(Magic Function),其意义是将那些用于matplotlib绘制的图显示在页面里而不是弹出一个窗口,因此就不需要plt.show()这一语句来显示图片,如下图所示: 因为这是 IPython 中的命令函数,因此只能在 jupyter notebook 阅读全文