随笔分类 - 机器学习
摘要:前面讲了神经网络的前向传播算法,下面再对反向传播算法进行总结。 反向传播算法也称为误差逆传播(error BackPropagation),是指基于梯度下降对神经网络的损失函数进行迭代优化求极小值的过程,它不仅可应用于前馈神经网络,还可以用于其他类型的神经网络。需要注意的是,大家提及到的“BP网络”
阅读全文
摘要:神经网络介绍 T. Kohonen于1988年在Neural Networks创刊号上给出了神经网络的定义:神经网络是由具有适应性的简单单元组成的广泛并互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。 神经网络中最基本的成分是神经元(neuron)模型(即上述定义中的“简单单
阅读全文
摘要:1957年科学家Frank Rosenblatt 开发了感知机这一人工神经元。感知机是二类分类的线性分类模型,属于判别模型。它由两层神经元组成,输入层接收样本的特征,输出层产生样本的二进制类别。 感知机模型 假设我们有m个样本,每个样本有n个特征,对应的输出结果y为-1或1。感知机的工作原理就是输入
阅读全文
摘要:参考:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_recall_curve.html 在分类模型的性能评估指标总结章节中,提到的Precision-Recall 曲线可通过sklearn库中的
阅读全文
摘要:在分类模型的性能评估指标总结中,已讲过混淆矩阵形式,接下来将介绍如何通过sklearn库中的confusion_matrix函数快速获得混淆矩阵。 语法格式 sklearn.metrics.confusion_matrix(y_true, y_pred, *, labels=None, sample
阅读全文
摘要:参考:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.auc.html 在分类模型的性能评估指标总结章节中,我们讲到AUC曲线是分类模型的性能评价指标之一。接下来将对sklearn库中AUC曲线的具体计算方式进行讲解
阅读全文
摘要:参考:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html 在分类模型的性能评估指标总结章节中,我们讲到ROC曲线是分类模型的性能评价指标之一。接下来将进一步对sklearn库中ROC曲线的计
阅读全文
摘要:机器学习中所用模型的好坏需要通过一些量化的指标来评估。对于分类模型,是通过:1)精度(Accuracy);2)准确率(Precision);3)召回率(Recall);4)F1分数;5)ROC曲线(Receiver operating characteristic curve,受试者工作特征曲线);
阅读全文
摘要:在线性回归模型中,拟合函数 输出一组连续型标签值。当标签是离散型变量,或者说想做分类任务,可通过引入联系函数(link function), 得到一个“广义线性模型”实现分类。 二分类模型 对于二分类模型,Sigmoid函数正是这样一个联系函数: $y=\frac{1}{1+e^{-h(x
阅读全文
摘要:基本形式 线性回归(linear regression)通过学习获得一个线性模型以尽可能准确地预测实际标签值。对于具有m个样本的数据集,给定 个特征,其线性回归模型如下: $h(x)=\theta_0+\theta_1x_1+\theta_2x_2+...+\theta_nx_n=\sum\li
阅读全文
摘要:参考:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html 在了解逻辑回归原理(见逻辑回归原理总结)的基础上,进一步对sklearn库中的LogisticRegre
阅读全文
摘要:参考:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html 目的:将数组或矩阵分割为随机的训练和测试子集。 语法格式 sklearn.model_selectio
阅读全文