摘要: 本文简单整理了以下内容: (一)马尔可夫随机场(Markov random field,无向图模型)简单回顾 (二)条件随机场(Conditional random field,CRF) 这篇写的非常浅,基于 [1] 和 [5] 梳理。感觉 [1] 的讲解很适合完全不知道什么是CRF的人来入门。如果 阅读全文
posted @ 2021-01-22 16:12 早起的小虫子 阅读(618) 评论(0) 推荐(1) 编辑
摘要: 主题模型(topic model)是以非监督学习的方式对文集的隐含语义结构(latent semantic structure)进行聚类(clustering)的统计模型。 主题模型主要被用于自然语言处理(Natural language processing)中的语义分析(semantic ana 阅读全文
posted @ 2021-01-20 20:55 早起的小虫子 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 主题模型在机器学习和自然语言处理等领域是用来在一系列文档中发现抽象主题的一种统计模型。直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。比方说,如果一篇文章是在讲狗的,那「狗」和「骨头」等词出现的频率会高些。如果一篇文章是在讲猫的,那「猫」和「鱼」等词出现的频率会高些。而有些词例 阅读全文
posted @ 2021-01-20 11:55 早起的小虫子 阅读(886) 评论(0) 推荐(0) 编辑
摘要: 隐马尔可夫模型(Hidden Markov Model,HMM)是可用于标注问题的统计学习模型,描述由隐藏的马尔可夫链随机生成观测序列的过程,属于生成模型。HMM在语音识别、自然语言处理、生物信息、模式识别等领域都有着广泛的应用。 一、 HMM模型的定义 HMM模型是关于时序的概率模型,描述由一个隐 阅读全文
posted @ 2021-01-17 17:28 早起的小虫子 阅读(1230) 评论(0) 推荐(1) 编辑
摘要: 一、SVM和LR的相同点 1、LR和SVM都是分类算法 看到这里很多人就不会认同了,因为在很大一部分人眼里,LR是回归算法。我是非常不赞同这一点的,因为我认为判断一个算法是分类还是回归算法的唯一标准就是样本label的类型,如果label是离散的,就是分类算法,如果label是连续的,就是回归算法。 阅读全文
posted @ 2021-01-15 16:15 早起的小虫子 阅读(620) 评论(0) 推荐(0) 编辑
摘要: SVM简介 支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;SVM还包括核技巧,这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题 阅读全文
posted @ 2021-01-15 11:49 早起的小虫子 阅读(32954) 评论(0) 推荐(1) 编辑
摘要: 一、为什么要正则化 学习算法,包括线性回归和逻辑回归,它们能够有效地解决许多问题,但是当将它们应用到某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。正则化(regularization)技术,可以改善或者减少过度拟合问题,进而增强泛化能力。泛化误差( 阅读全文
posted @ 2021-01-10 13:57 早起的小虫子 阅读(5042) 评论(0) 推荐(1) 编辑
摘要: 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布(i.i.d,independently and identically distributed),即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该 阅读全文
posted @ 2021-01-04 22:04 早起的小虫子 阅读(6424) 评论(0) 推荐(1) 编辑
摘要: Word2vec是目前最常用的词嵌入模型之一。是一种浅层的神经网络模型,他有2种网络结构,分别是CBOW(continues bag of words)和 skip-gram。Word2vec 其实是对”上下文-单词“矩阵进行学习,其中上下文由周围的几个单词组成,由此得到的词向量表示 更多的融入了上 阅读全文
posted @ 2020-12-26 16:39 早起的小虫子 阅读(1581) 评论(0) 推荐(0) 编辑
摘要: 在机器学习的核心内容就是把数据喂给一个人工设计的模型,然后让模型自动的“学习”,从而优化模型自身的各种参数,最终使得在某一组参数下该模型能够最佳的匹配该学习任务。那么这个“学习”的过程就是机器学习算法的关键。梯度下降法就是实现该“学习”过程的一种最常见的方式,尤其是在深度学习(神经网络)模型中,BP 阅读全文
posted @ 2020-12-23 23:31 早起的小虫子 阅读(4997) 评论(0) 推荐(0) 编辑