topbookcc

2022年5月28日

摘要： GBDT GBDT(Gradient Boosting Decision Tree)，全名叫梯度提升决策树，使用的是Boosting的思想。 Boosting思想 Boosting方法训练基分类器时采用串行的方式，各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加，每一层在训练的时候，对前一层阅读全文

posted @ 2022-05-28 09:51 topbookcc 阅读(223) 评论(0) 推荐(0)

2022年4月29日

Linux ssh免密钥登陆配置

摘要： ssh免密钥登录本机在相应的用户根目录下生成密钥公钥，输入如下命令 ssh-keygen -t rsa 直接三次回车，生成公钥、密钥文件在远程服务器.ssh文件下创建authorized_keys文件，赋予权限700 chmod 700 authorized_keys 将自己的公钥（id_rsa 阅读全文

posted @ 2022-04-29 10:18 topbookcc 阅读(63) 评论(0) 推荐(0)

2022年4月25日

leetcode-topK问题

摘要：最小K个数 1. 题目描述输入整数数组 arr ，找出其中最小的 k 个数。例如，输入4、5、1、6、2、7、3、8这8个数字，则最小的4个数字是1、2、3、4。示例输入：arr = [3,2,1], k = 2 输出：[1,2] 或者 [2,1] 2. 解题思路方法一：先排序，取前k 代码阅读全文

posted @ 2022-04-25 11:17 topbookcc 阅读(76) 评论(0) 推荐(0)

2022年4月24日

python-bisect库

摘要： 1. 简介 bisect是python内置模块，用于有序序列的插入和查找。查找： bisect(array, item) 插入： insort(array,item 2. insort函数 3. bisect_left查找元素，返回目标的左边位置函数定义：bisect.bisect_left( 阅读全文

posted @ 2022-04-24 17:30 topbookcc 阅读(120) 评论(0) 推荐(0)

2022年4月22日

leetcode-机器人的运动范围

摘要： 1. 题目描述地上有一个m行n列的方格，从坐标 [0,0] 到坐标 [m-1,n-1] 。一个机器人从坐标 [0, 0] 的格子开始移动，它每次可以向左、右、上、下移动一格（不能移动到方格外），也不能进入行坐标和列坐标的数位之和大于k的格子。例如，当k为18时，机器人能够进入方格 [35, 37 阅读全文

posted @ 2022-04-22 16:06 topbookcc 阅读(88) 评论(0) 推荐(0)

leetcode-矩阵中的路径

摘要： 1. 题目描述给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中，返回 true ；否则，返回 false 。单词必须按照字母顺序，通过相邻的单元格内的字母构成，其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一个单元格内的字母不允许阅读全文

posted @ 2022-04-22 15:40 topbookcc 阅读(72) 评论(0) 推荐(0)

2022年4月20日

论文阅读-RoBERTa

摘要：今天分享一个Bert的改进工作RoBERTa。RoBERTa是训练充分的Bert。论文：RoBERTa: A Robustly Optimized BERT Pretraining Approach 代码：https://github.com/brightmart/roberta_zh 1. 方法阅读全文

posted @ 2022-04-20 16:41 topbookcc 阅读(328) 评论(0) 推荐(0)

模型压缩-轻量化Bert模型

摘要： bert之类的预训练模型在NLP各项任务上取得的效果是显著的，但是因为bert的模型参数多，推断速度慢等原因，导致bert在工业界上的应用很难普及，针对预训练模型做模型压缩是促进其在工业界应用的关键，今天介绍几篇轻量化bert模型—DistillBert, ALBERT。一. DistillBer 阅读全文

posted @ 2022-04-20 11:40 topbookcc 阅读(644) 评论(0) 推荐(0)

2022年4月15日

机器学习-L1和L2正则化理解

摘要：一. 正则化 1. 什么是正则化正则化(Regularization) 是机器学习中对原始损失函数引入额外信息（模型复杂度惩罚项），以便防止过拟合和提高模型泛化性能的一类方法的统称。也就是目标函数变成了原始损失函数+额外项. 常用的额外项一般有两种，英文称作$ℓ1−norm$和$ℓ2−norm$ 阅读全文

posted @ 2022-04-15 17:46 topbookcc 阅读(322) 评论(0) 推荐(0)

2022年4月12日

极大似然估计和最大后验概率估计

摘要：一、频率学派和贝叶斯派 1. 频率学派他们认为世界是确定的。也就是说事件在多次重复实验中趋于一个稳定的值p，这个值就是该事件的概率。参数估计方法-极大似然估计（MLE）特点：这种方法往往在大数据量的情况下可以很好的还原模型的真实情况。 2. 贝叶斯学派认为世界是不确定的，对世界先有一个预先的阅读全文

posted @ 2022-04-12 16:39 topbookcc 阅读(252) 评论(0) 推荐(0)

2022年4月8日

python-heapq库的使用

摘要：一、heapq库简介 heapq 库是Python标准库之一，提供了构建小顶堆的方法和一些对小顶堆的基本操作方法(如入堆，出堆等)，可以用于实现堆排序算法。二、使用heapq创建堆 1. heappush(heap, num)，数据推入先创建一个空堆，然后将数据依次添加到堆中。每添加一个数据后，阅读全文

posted @ 2022-04-08 20:47 topbookcc 阅读(399) 评论(0) 推荐(0)

2022年4月3日

leetcode-最长回文子串

摘要：题目描述给你一个字符串 s，找到 s 中最长的回文子串。示例输入：s = "babad" 输出："bab" 解释："aba" 同样是符合题意的答案。动态规划对于一个子串而言，如果它是回文串，并且长度大于 2，那么将它首尾的两个字母去除之后，它仍然是个回文串。例如对于字符串 “ababa”，阅读全文

posted @ 2022-04-03 16:25 topbookcc 阅读(46) 评论(0) 推荐(0)

2022年3月29日

leetcode-逆序对

摘要：题目描述在数组中的两个数字，如果前面一个数字大于后面的数字，则这两个数字组成一个逆序对。输入一个数组，求出这个数组中的逆序对的总数。示例输入: [7,5,6,4] 输出: 5 归并排序与逆序对合并阶段本质上是合并两个排序数组的过程，而每当遇到左子数组当前元素 > 右子数组当前元素时阅读全文

posted @ 2022-03-29 15:23 topbookcc 阅读(174) 评论(0) 推荐(0)

2022年3月28日

leetcode-归并排序

摘要：归并排序归并排序就是先把左半边数组排好序，再把右半边数组排好序，然后把两半数组合并。算法框架 // 定义：排序 nums[lo..hi] void sort(int[] nums, int lo, int hi) { if (lo == hi) { return; } int mid = (lo 阅读全文

posted @ 2022-03-28 20:27 topbookcc 阅读(126) 评论(0) 推荐(0)

2022年3月24日

机器学习-生成模型 vs 判别模型

摘要：一. 判别模型由数据直接学习决策函数$f(X)$ 或者条件概率分布$p(Y|X)$作为预测模型，即判别模型。判别方法关系的是给定的输入 $X$ ，应该预测什么样的输出 $Y$。典型的判别模型包括：k近邻(knn)、感知机、逻辑斯蒂回归模型、最大熵模型、支持向量机、提升方法和条件随机场等。阅读全文

posted @ 2022-03-24 15:39 topbookcc 阅读(153) 评论(0) 推荐(0)

公告