摘要:
朴素贝叶斯(Naive Bayes)是基于贝叶斯定理与特征条件独立假设的分类方法。即对于给定的训练数据,首先基于特征条件独立假设学习输入输出联合概率分布,然后基于此模型,对给定输入的x,利用贝叶斯定理输出最大的后验概率y。 假设输入空间X,对应的输出空间Y为标记集合,而且在这些数据集中先验分布概率为 阅读全文
摘要:
k近邻算法(k-nearest neighbor,k-NN)是一种基本分类与回归方法。对新的输入实例,在给定的训练数据集中找到与这实例最邻近的k个实例。然后根据决策规则(如多数服从少数)决定这新输入实例点的类别。 本k临近模型的三个基本要素--距离度量、k值的选择和分类决策规则的决定。 1. 距离度 阅读全文
摘要:
1. 概论 统计学习是基于计算机基于数据构建概率统计模型并将其用于分析和预测。 监督学习、无监督学习、强化学习等是统计学习或机器学习的基本分类。 监督学习的本质是学习输入到输出的映射的统计规律。 无监督学习的本质是学习数据种的统计规律或潜在结构。 而强化学习的本质则是学习最优的序贯决策。 统计学习方 阅读全文