摘要:
1. 背景(Two-stage NAS) 该篇论文(AttentiveNAS)聚焦的是Two-stage NAS,比较出名的算法有 BigNAS,Once-for-all NAS (OFA), SPOS等等,不过他们都采用的uniform的采样去训练Supernet,即把所有的子网一视同仁,尽可能分 阅读全文
摘要:
若随机变量$X$服从二项分布,即$X\sim B(n,p)$, 则有$P(X=k)=C_nkpk(1-p)^{n-k}$,其均值和方差分别是 \(E(X)=np\) \(D(X)=np(1-p)\) 之前学二项分布的时候看到它的期望和方差觉得形式很简单,就没怎么细看推导过程。但是自己去推导的时候发现 阅读全文
摘要:
假设我的项目目录大致如下 myapp/ ├── myapp │ ├── configs │ │ ├── data │ │ │ └── data.yaml │ │ └── trainer │ │ └── trainer.yaml │ ├── __init__.py │ ├── run.py │ └── 阅读全文
摘要:
> 开始介绍之前还是老样子先吐槽一下教科书不说人话,喜欢端着,真是耽误了一群数学天才。 # 伯努利分布 伯努利分布很好理解,常见的例子就是抛硬币,假设硬币正面朝上的概率是 p,所以伯努利分布的**概率质量函数(probability mass function,简写作pmf**)是: > 注意区分概 阅读全文
摘要:
什么是先验/后验概率 我们先给出一些符号定义,令$\theta$表示模型参数,$D$表示数据。 先验概率比较好理解,比如 $p(D)$就表示数据的先验概率(prior probability)。 但是在之前我经常搞不明白 $p(D|\theta)$ 和$p(\theta|D)$ 哪个才是后验概率(p 阅读全文
摘要:
说人话搞懂【极大似然估计】和【最大后验概率】的区别 什么是先验/后验概率 我们先给出一些符号定义,令表示模型参数,表示数据。 先验概率比较好理解,比如 就表示数据的先验概率(prior probability)。 但是在之前我经常搞不明白 和 哪个才是后验概率(posterior probabili 阅读全文
摘要:
前言 pin_memory 和 non_blocking的作用分别是什么?网上看了很多解释,只是稀里糊涂的有个感觉,就是用了这玩意速度能变快,但是不知所以然,这篇文章希望能帮助你解惑,也给自己做个笔记,以备日后查阅。 train_sampler = None train_loader = torch 阅读全文
摘要:
参考: https://www.liujiangblog.com/course/python/83 阅读全文
摘要:
因为某些不知名的骚操作,我在git push自己的代码时提示下面这样的报错信息 remote: Permission to marsggbo/xxx.git denied to 其他用户名. fatal: unable to access 'https://github.com/marsggbo/x 阅读全文
摘要:
原文(有修改): https://developer.51cto.com/art/202107/669695.htm 我们知道,在使用 Git 的时候,应该要正确使用它的分支(Branch)功能。不同的功能使用不同的分支开发,最后合并进入主分支。但有时候会出现这样一种情况——我代码都已经写完了,才发 阅读全文