摘要: 在深度学习模型的训练过程中,经常会遇到这样的现象:每次训练,虽然初始值、随机种子、训练数据的顺序不一样,但是得到的loss曲线都差不多,在验证集上的结果也差不多.这篇论文从land scape的角度解释了这个问题:神经网络的loss landscape并不是我们想象中的很混乱、毫无规律,而是在per 阅读全文
posted @ 2024-11-11 15:15 MSTK 阅读(5) 评论(0) 推荐(0) 编辑
摘要: Tiny ImageNet是ImageNet的子集,ImageNet太大了,训练一次要好几天,于是准备用Tiny ImageNet代替ImageNet,但是MMPretrain项目里面用的全部都是ImageNet,需要做一些修改才能使用Tiny ImageNet. /mmpretrain/mmpre 阅读全文
posted @ 2024-10-28 14:38 MSTK 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 以前的Ubuntu系统用的机械硬盘,因为读写次数太多,已经出现问题了,速度很慢,开机提示坏道,于是买了一个固态硬盘,准备重装系统,但是重装系统,各种驱动、环境都要重装,太麻烦了,于是准备把以前的硬盘完整的复制到新硬盘,这样就不用重装各种驱动、环境了. 把新硬盘接上主板后,输入以下dd命令: sudo 阅读全文
posted @ 2024-09-09 16:56 MSTK 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 用PyCharm调试时变量实现不出来,一直显示Collecting data...: 解决的办法是File-->Settings-->Python Debugger,选中Gevent compatible: 问题顺利解决,变量很快就出来了: 阅读全文
posted @ 2024-08-24 17:05 MSTK 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 简单的说,Label Smoothing就是把one-hot向量从[0,0,1,0,0,0,...,0]变成[0.01,0.01,0.8,0.01,0.01,0.01,...,0.01],用公式表示,就是 其中,k是类别数量,a是一个较小的数.这样做的目的是为了缓解模型过于武断的问题,增强模型的泛化 阅读全文
posted @ 2024-07-29 21:14 MSTK 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 调试的时候遇到了下面的错误: java.lang.SecurityException: Writable dex file '/data/data/com.deepcode.trace/code_cache/.overlay/base.apk/classes3.dex' is not allowed 阅读全文
posted @ 2024-06-25 18:26 MSTK 阅读(396) 评论(0) 推荐(0) 编辑
摘要: 在Android Studio打开项目时,出现了下载Gradle超时,导致项目无法运行. 首先在gradle-wrapper.properties文件中,查看Gradle版本和zipStorePath: 然后查看Gradle包存放的位置: 到https://mirrors.cloud.tencent 阅读全文
posted @ 2024-05-25 18:42 MSTK 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 实现了同一个PageAbility内部不同AbilitySlice之间的导航. 首先新建一个AbilitySlice2,将其加入MainAblity: addActionRoute("my.action", AbilitySlice2.class.getName()); 在config.json中配 阅读全文
posted @ 2024-04-28 17:40 MSTK 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 1. 在https://developer.harmonyos.com网站上注册账号; 2. 下载DevEco Studio安装文件,选择Windows 64位版本; 3. 运行安装文件,开始安装; 4. 选择Do not import settings; 5. 运行DevEco Studio,安装 阅读全文
posted @ 2024-03-31 18:47 MSTK 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 1. 安装Python,默认已经安装; 2. 安装VSCode,默认已经安装,如果版本低,可以更新到最新版本; 3. 在https://device.harmonyos.com/cn/develop/ide#download下载DevEco Device Tool 4.0 Release,选择Lin 阅读全文
posted @ 2024-02-24 17:49 MSTK 阅读(508) 评论(0) 推荐(1) 编辑
摘要: 跑Cifar,发现训练时间很长,仔细一看,原来cudaGetDeviceCount()返回的是0,就是说没有找到GPU,没有用GPU跑,是在用CPU跑,难怪时间这么长. 在终端输入nvidia-smi,出现了以下错误: Failed to initialize NVML: Driver/librar 阅读全文
posted @ 2024-01-30 17:24 MSTK 阅读(832) 评论(0) 推荐(0) 编辑
摘要: 1. 在命令窗口中输入下面两个命令: pip install pyqt5 pip install pyqt5-tools 2. 打开PyCharm的File->Settings->Tools->External Tools,单击Add,在弹出的窗口中输入: Name: QtDisigner Prog 阅读全文
posted @ 2023-12-31 16:47 MSTK 阅读(16) 评论(0) 推荐(0) 编辑
摘要: Qualitative Results如下图所示: 阅读全文
posted @ 2023-11-26 16:30 MSTK 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 实验结果如下图所示: 阅读全文
posted @ 2023-10-30 23:02 MSTK 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 损失函数分为3种类型: (1) 对于热力图,用以下的Focal Loss计算: (2) 对于深度,采用Laplacian aleatoric uncertainty loss function for depth计算: (3) 对于尺寸采用L1 Loss计算: 阅读全文
posted @ 2023-09-29 23:54 MSTK 阅读(26) 评论(0) 推荐(0) 编辑
摘要: Feature backbone采用DLA,输入维度为3×H×W的RGB图,得到维度D×h×w的特征图F,然后将特征图送入几个轻量级regression heads,2D bouding boxes的中心特征图用下面的模块得到: 其中AN是Attentive Normalization.用公式表示: 阅读全文
posted @ 2023-08-29 21:30 MSTK 阅读(13) 评论(0) 推荐(0) 编辑
摘要: MonoCon的网络结构和MonoDLE几乎一样,只是添加了辅助学习(Auxiliary Learning, AL)模块. 网络结构如上图所示,对于3D目标检测来说,预测2D框是没有必要的,但是MonoCon在训练阶段仍然计算了2D框的损失函数,但是在推理的时候,并不会预测2D框,这就是所谓的辅助学 阅读全文
posted @ 2023-07-27 17:43 MSTK 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 作者认为单目3D目标检测可以简化为深度估计问题,深度估计不准确限制了检测的性能.已有的算法直接使用孤立实例或者像素估计深度,没有考虑目标之间的集合关系,因此提出了构建预测的目标之间的几何关系图,来促进深度预测. 将深度值划分成若干个区间,然后通过分布的期望来计算深度值,在精度和速度上都取得了不错的性 阅读全文
posted @ 2023-06-22 17:32 MSTK 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 进入git目录,输入以下命令: sudo git init --bare 仓库名.git sudo chown -R 用户名:用户名 仓库名.git 仓库的URL地址为: 用户名@IP:git目录/仓库名.git 在PyCharm中右键单击项目文件夹,选择Git->Manage Remotes,添加 阅读全文
posted @ 2023-05-11 15:50 MSTK 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 运行: sudo apt update 提示: E: 有几个软件包无法下载,要不运行 apt-get update 或者加上 --fix-missing 的选项再试试? 于是运行: apt-get update --fix-missing 运行: sudo apt-get install build 阅读全文
posted @ 2023-05-04 12:16 MSTK 阅读(4498) 评论(0) 推荐(0) 编辑
摘要: 模型如下图所示: 将H×W×C的图像reshape成了N×(P2×C),其中(H,W)是图像的原始分辨率,C是通道数,(P,P)是每个图像块的分辨率,N=H×W/P2为图像块的数量,将一个图像块使用可学习的线性层映射到维度为D的隐藏向量,如式(1)所示,线性映射的输出称为patch embeddin 阅读全文
posted @ 2023-04-29 23:45 MSTK 阅读(60) 评论(0) 推荐(0) 编辑
摘要: MMDetection的学习率设置文件放在目录mmdetection3d\configs\_base_\schedules\下面,如下图所示. 各文件的含义如下: consine.py: SGDR policy, 40epochs; cyclic_20e.py: CLR policy, 20 epo 阅读全文
posted @ 2023-03-30 21:39 MSTK 阅读(279) 评论(0) 推荐(0) 编辑
摘要: SGDR和CLR比较类似,都是给学习率设置周期和变化范围,按照下面的公式让学习率周期性的变化: 总的来说,就是在一个周期开始时,将学习率设置为最大值,然后按照余弦函数减小到最小值,再开始下一个周期的循环.尝试了各种超参数的设置. 阅读全文
posted @ 2023-02-20 16:52 MSTK 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 学习率的设置是深度学习中一个比较重要的问题,Cyclical Learning Rates(CLR)提出了一种新的方法,即让学习率周期性的变化,而不是像之前的方法那样让学习率单调递减变化. Cyclical learning rates其实比较简单,只需要3个参数: (1)base_lr:学习率的最 阅读全文
posted @ 2023-01-27 19:30 MSTK 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 很多深度学习都是多任务学习(Multi-Task Learning, MTL),需要对多个Loss同时优化,模型的性能受各Loss的权重的影响,手工选择权重成本太高,是不可能的,于是提出了基于Uncertainty的自动学习权重的方式. 下图是一个典型的多任务学习场景,需要同时满足语义分割,实例分割 阅读全文
posted @ 2022-12-17 21:04 MSTK 阅读(436) 评论(0) 推荐(0) 编辑
摘要: ImVoxelNet这是一种基于单目或多视图 RGB 图像的 3D 对象检测的新型全卷积方法,根据RGB图进行3D检测. 这种方法其实比较简单,先在多张2D RGB图上进行卷积操作(共享2D卷积核),然后将特征映射到3D体素上,同一个体素有多个特征的进行简单的平均池化操作,然后用3D卷积核进行卷积操 阅读全文
posted @ 2022-11-13 14:40 MSTK 阅读(300) 评论(0) 推荐(0) 编辑
摘要: Part-A2是一个两阶段,基于点的3D目标检测器,由part-aware和part-aggregation模块组成.类似于两阶段的2D检测器,第一阶段提出Proposals,第二阶段进行Refine. 1. Part-aware模块 负责生成3D Proposals.先将3D空间体素化,每个体素大 阅读全文
posted @ 2022-10-30 17:12 MSTK 阅读(85) 评论(0) 推荐(0) 编辑
摘要: FCOS3D是在2D检测器FCOS的基础上提出的,是一种单目3D检测算法,根据RGB图像进行3D目标检测.FCOS预测的是一个前景点到边界框的4个距离,而FCOS3D需要预测更多的东西,包括3D中心点,3D尺寸,以及目标的方向. 整体结构上,FCOS3D和FCOS非常类似,Backbone和Neck 阅读全文
posted @ 2022-09-29 20:56 MSTK 阅读(836) 评论(0) 推荐(0) 编辑
摘要: MMdetection3D更新了,只好再次安装,由于CUDA,cuDNN,PyTorch以前已经安装了,这次就不需要安装了,只需要安装MMdetection3D就行了. 1. 安装MMCV 输入以下命令: pip install mmcv-full -f https://download.openm 阅读全文
posted @ 2022-08-14 15:27 MSTK 阅读(1559) 评论(0) 推荐(0) 编辑
摘要: 由于操作失误,把硬盘挂载到了/home,导致系统启动失败,用Ubuntu的安装U盘进入Try,然后输入以下命令: sudo gedit ./etc/fstab 发现fstab文件是这样的: # /etc/fstab: static file system information. # # Use ' 阅读全文
posted @ 2022-07-29 11:57 MSTK 阅读(459) 评论(0) 推荐(0) 编辑