摘要:
FM FM的主要内容 了解fm模型之前,需要先说一下lr带入一下场景。lr作为早期ctr预估里面的模型,其速度上有着无可比拟的优势,而偏偏ctr场景下伴随着有大量的离散特征,高维稀疏特征,这个很适合lr的场景。 lr整个模型可以被描述为一个公式: \(y=w_0+\sum_{i=1}^{n}w_i* 阅读全文
摘要:
梳理一下树模型算法,从三种最基础的tree到lgb的全过程笔记 基于信息增益(Information Gain)的ID3算法 ID3算法的核心是在数据集上应用信息增益准则来进行特征选择,以此递归的构建决策树,以信息熵和信息增益为衡量标准,从而实现对数据的归纳分类。 ID3算法需要解决的问题是如何选择 阅读全文
摘要:
RNN RNN背后的思想是利用顺序信息。在传统的神经网络中,我们假设所有的输入(包括输出)之间是相互独立的。对于很多任务来说,这是一个非常糟糕的假设。如果你想预测一个序列中的下一个词,你最好能知道哪些词在它前面。RNN之所以循环的,是因为它针对系列中的每一个元素都执行相同的操作,每一个操作都依赖于之 阅读全文
摘要:
输入一棵二叉树和一个整数,打印出二叉树中节点值的和为输入整数的所有路径。从树的根节点开始往下一直到叶节点所经过的节点形成一条路径。 首先需要注意的是:根结点出发->叶子节点才算是一条完整的路径 非递归-stack+先序遍历 先序遍历可以先一头压到低,再慢慢返回拿到结果 class Solution 阅读全文
摘要:
title: 给定一个数字,我们按照如下规则把它翻译为字符串:0 翻译成 “a” ,1 翻译成 “b”,……,11 翻译成 “l”,……,25 翻译成 “z”。一个数字可能有多个翻译。请编程实现一个函数,用来计算一个数字有多少种不同的翻译方法。 输入: 12258 输出: 5 解释: 12258有5 阅读全文
摘要:
深度优先搜索的实现一般有2种方式 递归 //todo #非递归-借助stack 因为栈后进先出的特点,使其很容易实现树/图的深度优先遍历。如果是BFS,那非递归经常借助queue。 整个过程可以被描述为: 根结点入栈 弹出根节点,右节点先入,其次左节点。这样,左节点总是最先被访问到,达到“深”的目的 阅读全文
摘要:
与上游仓库保持更新 https://github.com/selfteaching/the-craft-of-selfteaching/issues/67 远程代码更新到本地(强覆盖) https://www.shuzhiduo.com/A/E35pG87KJv/ 阅读全文
摘要:
什么是因果推断? 因果推断(Causal Inference):就是预估对某个对象/群体/人 等 做不做某种干预后产生的结果。 常说‘关系不代表因果’. 比如,一项研究表面,吃早餐的女孩比不吃早餐的女孩更瘦,因此得出结论:‘吃早餐能减肥‘。 但事实上,吃早餐和瘦这2件事也许只是存在相关性,瘦并不是吃 阅读全文
摘要:
wgan之前, 原始GAN出现了什么问题? https://www.cnblogs.com/Allen rg/p/10305125.html 1. 判别器越好,生成器梯度消失越严重 2. 一句话概括:最小化第二种生成器loss函数,会等价于最小化一个不合理的距离衡量,导致两个问题,一是梯度不稳定,二 阅读全文
摘要:
GAN的学习是一个二人博弈问题,最终目标是达到纳什平衡。对抗指的是生成网络和判别网络的互相对抗。生成网络尽可能生成逼真样本,判别网络则尽可能去判别该样本是真实样本,还是生成的假样本。示意图如下: 生成器尽量去生成一种合理的数据分布,可以理解为真实的数据, 从而让判别器无法判别样本究竟来自何方, 两者 阅读全文