摘要:
GBDT GBDT(Gradient Boosting Decision Tree),全名叫梯度提升决策树,使用的是Boosting的思想。 Boosting思想 Boosting方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加,每一层在训练的时候,对前一层 阅读全文
摘要:
ssh免密钥登录 本机在相应的用户根目录下生成密钥公钥,输入如下命令 ssh-keygen -t rsa 直接三次回车,生成公钥、密钥文件 在远程服务器.ssh文件下创建authorized_keys文件,赋予权限700 chmod 700 authorized_keys 将自己的公钥(id_rsa 阅读全文
摘要:
最小K个数 1. 题目描述 输入整数数组 arr ,找出其中最小的 k 个数。例如,输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。 示例 输入:arr = [3,2,1], k = 2 输出:[1,2] 或者 [2,1] 2. 解题思路 方法一:先排序,取前k 代码 阅读全文
摘要:
1. 简介 bisect是python内置模块,用于有序序列的插入和查找。 查找: bisect(array, item) 插入: insort(array,item 2. insort函数 3. bisect_left查找元素,返回目标的 左边位置 函数定义:bisect.bisect_left( 阅读全文
摘要:
1. 题目描述 地上有一个m行n列的方格,从坐标 [0,0] 到坐标 [m-1,n-1] 。一个机器人从坐标 [0, 0] 的格子开始移动,它每次可以向左、右、上、下移动一格(不能移动到方格外),也不能进入行坐标和列坐标的数位之和大于k的格子。 例如,当k为18时,机器人能够进入方格 [35, 37 阅读全文
摘要:
1. 题目描述 给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中,返回 true ;否则,返回 false 。 单词必须按照字母顺序,通过相邻的单元格内的字母构成,其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一个单元格内的字母不允许 阅读全文
摘要:
今天分享一个Bert的改进工作RoBERTa。RoBERTa是训练充分的Bert。 论文:RoBERTa: A Robustly Optimized BERT Pretraining Approach 代码:https://github.com/brightmart/roberta_zh 1. 方法 阅读全文
摘要:
bert之类的预训练模型在NLP各项任务上取得的效果是显著的,但是因为bert的模型参数多,推断速度慢等原因,导致bert在工业界上的应用很难普及,针对预训练模型做模型压缩是促进其在工业界应用的关键,今天介绍几篇轻量化bert模型—DistillBert, ALBERT。 一. DistillBer 阅读全文
摘要:
一. 正则化 1. 什么是正则化 正则化(Regularization) 是机器学习中对原始损失函数引入额外信息(模型复杂度惩罚项),以便防止过拟合和提高模型泛化性能的一类方法的统称。也就是 目标函数变成了原始损失函数+额外项. 常用的额外项一般有两种,英文称作$ℓ1−norm$和$ℓ2−norm$ 阅读全文
摘要:
一、频率学派和贝叶斯派 1. 频率学派 他们认为世界是确定的。也就是说事件在多次重复实验中趋于一个稳定的值p,这个值就是该事件的概率。 参数估计方法-极大似然估计(MLE) 特点:这种方法往往在大数据量的情况下可以很好的还原模型的真实情况。 2. 贝叶斯学派 认为世界是不确定的,对世界先有一个预先的 阅读全文
摘要:
一、heapq库简介 heapq 库是Python标准库之一,提供了构建小顶堆的方法和一些对小顶堆的基本操作方法(如入堆,出堆等),可以用于实现堆排序算法。 二、使用heapq创建堆 1. heappush(heap, num),数据推入 先创建一个空堆,然后将数据依次添加到堆中。每添加一个数据后, 阅读全文
摘要:
题目描述 给你一个字符串 s,找到 s 中最长的回文子串。 示例 输入:s = "babad" 输出:"bab" 解释:"aba" 同样是符合题意的答案。 动态规划 对于一个子串而言,如果它是回文串,并且长度大于 2,那么将它首尾的两个字母去除之后,它仍然是个回文串。例如对于字符串 “ababa”, 阅读全文
摘要:
题目描述 在数组中的两个数字,如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。输入一个数组,求出这个数组中的逆序对的总数。 示例 输入: [7,5,6,4] 输出: 5 归并排序与逆序对 合并阶段 本质上是 合并两个排序数组 的过程,而每当遇到 左子数组当前元素 > 右子数组当前元素 时 阅读全文
摘要:
归并排序 归并排序就是先把左半边数组排好序,再把右半边数组排好序,然后把两半数组合并。 算法框架 // 定义:排序 nums[lo..hi] void sort(int[] nums, int lo, int hi) { if (lo == hi) { return; } int mid = (lo 阅读全文
摘要:
一. 判别模型 由数据直接学习决策函数$f(X)$ 或者条件概率分布$p(Y|X)$作为预测模型,即判别模型。判别方法关系的是给定的输入 \(X\) ,应该预测什么样的输出 \(Y\)。 典型的判别模型包括:k近邻(knn)、感知机、逻辑斯蒂回归模型、最大熵模型、支持向量机、提升方法和条件随机场等。 阅读全文