摘要: 很久没有写总结了,这篇博客仅作为最近的一些尝试内容,记录一些心得。FFM的优势是可以处理高维稀疏样本的特征组合,已经在无数的CTR预估比赛和工业界中广泛应用,此外,其也可以与Deep Networks结合(如DeepFM等工作),很好地应用在数据规模足够大的工业场景中。Recurrent Entit 阅读全文
posted @ 2019-05-10 17:01 蓝鲸王子 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 在之前的强化学习文章里,我们讲到了经典的MDP模型来描述强化学习,其解法包括value iteration和policy iteration,这类经典解法基于已知的转移概率矩阵P,而在实际应用中,我们很难具体知道转移概率P。伴随着这类问题的产生,Q-Learning通过迭代来更新Q表拟合实际的转移概 阅读全文
posted @ 2019-03-30 16:04 蓝鲸王子 阅读(1804) 评论(0) 推荐(0) 编辑
摘要: 本文主要介绍强化学习的一些基本概念:包括MDP、Bellman方程等, 并且讲述了如何从 MDP 过渡到 Reinforcement Learning。 1. 强化学习基本概念 这里还是放上David Silver的课程的图,可以很清楚的看到整个交互过程。这就是人与环境交互的一种模型化表示,在每个时 阅读全文
posted @ 2019-03-28 16:53 蓝鲸王子 阅读(3823) 评论(0) 推荐(2) 编辑
摘要: 一、softmax函数 softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类! 假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值就是: $$ S_i = \frac{e^j }{ \sum\nolimits 阅读全文
posted @ 2018-07-09 18:53 蓝鲸王子 阅读(3468) 评论(0) 推荐(2) 编辑
摘要: 1. 随时间反向传播BPTT(BackPropagation Through Time, BPTT) RNN(循环神经网络)是一种具有长时记忆能力的神经网络模型,被广泛用于序列标注问题。一个典型的RNN结构图如下所示: 从图中可以看到,一个RNN通常由三小层组成,分别是输入层、隐藏层和输出层。与一般 阅读全文
posted @ 2018-05-10 17:23 蓝鲸王子 阅读(2714) 评论(0) 推荐(0) 编辑
摘要: A Survey of Model Compression and Acceleration for Deep Neural Networks 一、研究背景 在神经网络方面,早在上个世纪末,Yann LeCun等人已经使用神经网络成功识别了邮件上的手写邮编。至于深度学习的概念是由Geoffrey H 阅读全文
posted @ 2018-05-09 16:25 蓝鲸王子 阅读(16708) 评论(1) 推荐(0) 编辑
摘要: 根据《统计学习方法》一书中的描述,条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。 条件随机场是一种判别式模型。 一、理解条件随机场 1.1 HMM简单介绍 HMM即 阅读全文
posted @ 2017-12-15 17:05 蓝鲸王子 阅读(6797) 评论(0) 推荐(2) 编辑
摘要: EM算法,全称Expectation Maximization Algorithm,译作最大期望化算法或期望最大算法,是机器学习十大算法之一,吴军博士在《数学之美》书中称其为“上帝视角”算法,其重要性可见一斑。 EM算法是一种迭代算法,用于含有隐变量(hidden variable)的概率参数模型的 阅读全文
posted @ 2017-12-15 14:38 蓝鲸王子 阅读(1060) 评论(0) 推荐(0) 编辑
摘要: 维特比算法(Viterbi algorithm)是在一个用途非常广的算法,本科学通信的时候已经听过这个算法,最近在看 HMM(Hidden Markov model) 的时候也看到了这个算法。于是决定研究一下这个算法的原理及其具体实现,如果了解动态规划的同学应该很容易了解维特比算法,因为维特比算法的 阅读全文
posted @ 2017-12-13 17:49 蓝鲸王子 阅读(1140) 评论(0) 推荐(0) 编辑
摘要: 本文主要介绍隐马尔可夫模型以及该模型中的三大问题的解决方法。 隐马尔可夫模型的是处理序列问题的统计学模型,描述的过程为:由隐马尔科夫链随机生成不可观测的状态随机序列,然后各个状态分别生成一个观测,从而产生观测随机序列。 在这个过程中,不可观测的序列称为状态序列(state sequence), 由此 阅读全文
posted @ 2017-12-12 12:16 蓝鲸王子 阅读(12336) 评论(0) 推荐(3) 编辑
摘要: 信息检索概述 信息检索是当前应用十分广泛的一种技术,论文检索、搜索引擎都属于信息检索的范畴。通常,人们把信息检索问题抽象为:在文档集合D上,对于由关键词w[1] ... w[k]组成的查询串q,返回一个按查询q和文档d匹配度relevance(q, d)排序的相关文档列表D'。 对于这一问题,先后出 阅读全文
posted @ 2017-12-08 17:11 蓝鲸王子 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 一、数据的标准化(normalization)和归一化 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是数据的归一 阅读全文
posted @ 2017-12-02 19:29 蓝鲸王子 阅读(1563) 评论(0) 推荐(1) 编辑
摘要: 损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可 阅读全文
posted @ 2017-12-02 10:41 蓝鲸王子 阅读(19557) 评论(1) 推荐(2) 编辑
摘要: 监督学习的任务就是学习一个模型,应用这一模型,对给定的输入预测相应的输出。这个模型的一般形式为决策函数:$$ Y=f(X) $$或者条件概率分布:$$ P(Y|X) $$监督学习方法又可以分为生成方法(generative approach)和判别方法(discriminative approach 阅读全文
posted @ 2017-11-21 17:34 蓝鲸王子 阅读(513) 评论(1) 推荐(0) 编辑
摘要: 1. 比较一般的自定义函数: 需要注意的是,不能像sklearn那样直接定义,因为这里的y_true和y_pred是张量,不是numpy数组。示例如下: 用的时候直接: 2. 比较复杂的如AUC函数: AUC的计算需要整体数据,如果直接在batch里算,误差就比较大,不能合理反映整体情况。这里采用回 阅读全文
posted @ 2017-11-15 16:39 蓝鲸王子 阅读(11259) 评论(2) 推荐(0) 编辑
摘要: word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神 阅读全文
posted @ 2017-11-09 10:44 蓝鲸王子 阅读(2215) 评论(0) 推荐(2) 编辑
摘要: 前言 近年来,在自然语言研究领域中,评测问题越来越受到广泛的重视,可以说,评测是整个自然语言领域最核心和关键的部分。而机器翻译评价对于机器翻译的研究和发展具有重要意义:机器翻译系统的开发者可以通过评测得知系统存在的问题而不断改进,用户也可以根据评测报告选择满足自己需求的产品,而对于机器翻译的研究人员 阅读全文
posted @ 2017-11-07 18:28 蓝鲸王子 阅读(2752) 评论(0) 推荐(0) 编辑
摘要: 1. 从Google网页排序到PageRank算法 (1)谷歌网页怎么排序? 先对搜索关键词进行分词,如“技术社区”分词为“技术”和“社区”; 根据建立的倒排索引返回同时包含分词后结果的网页; 将返回的网页相关性(类似上篇文章所讲的文本相似度)网页,相关性越高排名越靠前 (2)怎么处理垃圾网页?那么 阅读全文
posted @ 2017-09-25 20:55 蓝鲸王子 阅读(4271) 评论(0) 推荐(2) 编辑
摘要: 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问题。这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文。知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正。谢谢。 监 阅读全文
posted @ 2017-09-24 17:55 蓝鲸王子 阅读(890) 评论(0) 推荐(0) 编辑
摘要: 在求取有约束条件的优化问题时,拉格朗日乘子法(Lagrange Multiplier) 和KKT条件是非常重要的两个求取方法,对于等式约束的优化问题,可以应用拉格朗日乘子法去求取最优值;如果含有不等式约束,可以应用KKT条件去求取。当然,这两个方法求得的结果只是必要条件,只有当是凸函数的情况下,才能 阅读全文
posted @ 2017-09-24 16:08 蓝鲸王子 阅读(610) 评论(0) 推荐(0) 编辑