摘要:
保研路漫长,希望大家都能够坚持下去,最终拿到自己满意的offer 2022年9月25日 个人情况 学校背景:末流985+rank2% 英语成绩:六级480 竞赛经历:CCPC铜奖,省赛金奖 + 水奖若干 科研经历:top2两个项目实习(一篇投CCF-A未中,一篇二作CCF-A在投) + cv相关 阅读全文
摘要:
混淆矩阵(Confusion Matrix) 1. 混淆矩阵引入 在机器学习领域,当我们想要衡量一个模型的优劣时,经常用到一些分析指标,如:错误率、准确率等。但是这两个指标并不能满足所有任务需求。比如超市打特价时我们去购物,有的人会关心“购买的东西中有多少是打特价的”,还有人会关心“打特价的商品中我 阅读全文
摘要:
信息量、熵、KL散度、交叉熵 相信很多小伙伴在学习交叉熵时,对交叉熵感觉到非常的迷惑。"交叉熵怎么来的?","为什么交叉熵的表达式是这样婶儿的?","熵和交叉熵到底有什么关系?"。本文通过由浅到深的顺序,来引入交叉熵,希望能对各位学习路上的小伙伴有所帮助,不足的地方恳请批评指正 一、 信息量 1. 阅读全文
摘要:
1. 中国剩余定理表述 设正整数两两互素,则同余方程组: \[ \begin{cases} x \equiv a_1(mod \quad m_1) \\ x \equiv a_2(mod \quad m_2) \\ \cdots\cdots\cdots\cdo 阅读全文
摘要:
简介 机器学习算法需要的数据往往会在不同的设备上产生,并且将数据集中起来是非常困难的,因此,分布式计算就成为了一种可行性方案。但分布式的计算学习会出现各种各样的问题,如下: 困难 分布式训练会导致不同设备训练出来的模型具有不同的分布特性,例如小明喜欢猫,小红喜欢狗,若进行图片分类,小明的模型对识别猫 阅读全文
摘要:
简介 机器学习问题经常需要大量的数据来进行模型的处理与改进,而这些数据又来源于世界的各个地方。把全世界的数据汇聚到一个数据中心是不可行的。所以,涵盖许多地区的多个数据中心应运而生。但是,在这些里程上特别远的数据中心网络中,即wide-area networks(WANs),网络通信的快慢是一个系统性 阅读全文
摘要:
简介 Deep Gradient Compression: Reducing the Communication Bandwidth for Distributed Training (arxiv.org) 本文针对当前的分布式机器学习形式提出了以下待解决的困难: bandwidth,梯度信息在节点 阅读全文
摘要:
@(差分约束系统与图论的联系) 差分约束系统 1.何为差分约束系统? 如果一个系统由n个变量和m个约束条件组成,约束条件形如 - ⇐ k(i,j∈[1,n]),则成为差分约束系统。 例如: - ⇐ 5 - ⇐ 2 阅读全文
摘要:
Logistic回归 1. 什么是Logistic回归 Logistic是一种常用的分类方法,属于对数线性模型,利用Logistic回归,根据现有数据对分类边界建立回归公式,以此进行分类。 回归:假设现有一些数据点,我们用一条直线对这些点进行拟合,这个拟合过程就称为回归 2. Logistic回归与 阅读全文
摘要:
随笔概要 本文通过01背包问题引入动态规划,来介绍各种背包与初等动态规划问题,持续更新中... 01背包问题 **问题概述:**有n个重量和价值分别为和的物品。从这些物品中挑选出总重量不超过的物品,求所有挑选方案中价值总和的最大值。(下标从1开始) 样例: \[ Input 阅读全文