机器学习:理论知识
一、混淆矩阵(Confusion matrix)
混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。具体评价指标有总体精度、制图精度、用户精度等,这些精度指标从不同的侧面反映了图像分类的精度。在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。矩阵的每一行表示预测类中的实例,而每一列表示实际类中的实例(反之亦然)。这个名字源于这样一个事实,即很容易看出系统是否混淆了两个类。
二、损失函数(Loss function)
在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。
三、先验知识(prior knowledge)
先验(apriori; 先天)在拉丁文中指‘来自先前的东西’,或稍稍引申指‘在经验之前’。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题‘所有的单身汉一定没有结婚’。
四、参数(parameter)
在数学和统计学里,参数是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。
五、迁移学习(Transfer learning)
迁移学习是一种机器学习方法,就是把为任务A开发的模型作为初始点,重新使用在为任务B开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。迁移学习对人类来说很常见,比如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。
六、准确率(Accuracy)
分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数。