摘要: 三个月之前 NLP 课程结课,我们做的是命名实体识别的实验。在MSRA的简体中文NER语料(我是从这里下载的,非官方出品,可能不是SIGHAN 2006 Bakeoff-3评测所使用的原版语料)上训练NER模型,识别人名、地名和组织机构名。尝试了两种模型:一种是手工定义特征模板后再用CRF++开源包 阅读全文
posted @ 2017-10-08 20:52 Determined22 阅读(67236) 评论(16) 推荐(18) 编辑
摘要: 本文简述了以下内容: 神经概率语言模型NPLM,训练语言模型并同时得到词表示 word2vec:CBOW / Skip-gram,直接以得到词表示为目标的模型 (一)原始CBOW(Continuous Bag-of-Words)模型 (二)原始Skip-gram模型 (三)word analogy 阅读全文
posted @ 2016-08-25 03:16 Determined22 阅读(19273) 评论(7) 推荐(3) 编辑
摘要: 这半年有几次机缘巧合的机会来给其他人科普强化学习的基本概念,我总体上是分成两部分来讲的:第一部分是强化学习背景和常用概念介绍;第二部分是 DQN、DDPG、PPO、SAC 四个算法的比较。这里分享一下第二部分的 slides。 此外我最近比较关注离线强化学习(Batch Reinforcement 阅读全文
posted @ 2020-09-15 21:06 Determined22 阅读(1939) 评论(0) 推荐(0) 编辑
摘要: LSA(Latent semantic analysis,隐性语义分析)、pLSA(Probabilistic latent semantic analysis,概率隐性语义分析)和 LDA(Latent Dirichlet allocation,隐狄利克雷分配)这三种模型都可以归类到话题模型(To 阅读全文
posted @ 2017-07-26 09:13 Determined22 阅读(7591) 评论(0) 推荐(0) 编辑
摘要: 本文简单整理了以下内容: (一)马尔可夫随机场(Markov random field,无向图模型)简单回顾 (二)条件随机场(Conditional random field,CRF) 这篇写的非常浅,基于 [1] 和 [5] 梳理。感觉 [1] 的讲解很适合完全不知道什么是CRF的人来入门。如果 阅读全文
posted @ 2017-05-31 02:04 Determined22 阅读(39786) 评论(5) 推荐(7) 编辑
摘要: 本文简单整理了以下内容: (一)贝叶斯网(Bayesian networks,有向图模型)简单回顾 (二)隐马尔可夫模型(Hidden Markov model,HMM) 写着写着还是写成了很规整的样子。以后可能会修改。 (一)贝叶斯网简单回顾 图模型(PGM)根据边是否有向,可以分为有向图模型和无 阅读全文
posted @ 2017-05-30 16:43 Determined22 阅读(16759) 评论(4) 推荐(1) 编辑
摘要: 看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字。这项任务要求模型可以识别图片中的物体、理解物体间的关系,并用一句自然语言表达出来。 应用场景:比如说用户在拍了一张照片后,利用 阅读全文
posted @ 2017-05-28 07:54 Determined22 阅读(24569) 评论(0) 推荐(1) 编辑
摘要: 这篇总结继续复习分类问题。本文简单整理了以下内容: (一)线性判别函数与广义线性判别函数 (二)感知器 (三)松弛算法 (四)Ho-Kashyap算法 闲话:本篇是本系列[机器学习基础整理]在timeline上最新的,但实际上还有(七)、(八)都发布的比这个早,因为这个系列的博客是之前早就写好的,不 阅读全文
posted @ 2017-04-21 21:25 Determined22 阅读(8593) 评论(2) 推荐(1) 编辑
摘要: 本文简单整理了以下内容: (一)线性回归 (二)二分类:二项Logistic回归 (三)多分类:Softmax回归 (四)广义线性模型 闲话:二项Logistic回归是我去年入门机器学习时学的第一个模型(忘记了为什么看完《统计学习方法》第一章之后直接就跳去了第六章,好像是对“逻辑斯蒂”这个名字很感兴 阅读全文
posted @ 2017-04-21 21:21 Determined22 阅读(10172) 评论(0) 推荐(2) 编辑
摘要: 本文简单整理了以下内容: (一)维数灾难 (二)特征提取——线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensionality) 维数灾难就是说当样本的维数增加时,若要保持与低维情形下相同的样本密度,所需要的样本数指数 阅读全文
posted @ 2017-04-13 16:07 Determined22 阅读(11747) 评论(0) 推荐(0) 编辑
摘要: 本文简述了以下内容: (一)生成式模型的非参数方法 (二)Parzen窗估计 (三)k近邻估计 (四)k近邻分类器(k-nearest neighbor,kNN) (一)非参数方法(Non-parametric method) 对于生成式模型(Generative model)来说,重要的地方在于类 阅读全文
posted @ 2017-04-13 16:03 Determined22 阅读(8206) 评论(2) 推荐(1) 编辑