摘要:
中科院&华为诺亚提出ViG:一种全新的骨干网络,性能不输CNN、ViT! ACM MM 2022 | DIG: 自监督文字识别的新框架,刷新11个公开场景文字数据集的识别性能,平均提升5% 已看文章: 特征,特征不变性,尺度空间与图像金字塔 ——日拱一卒(https://www.cnblogs.co 阅读全文
摘要:
多看看好文章: 对比学习:what is contrastive learning? 利用相似(similarity)和差异(difference)去理解现实世界的高级特征 Understanding domain adaptation a model trained on "source data 阅读全文
摘要:
神经网络模型 序号 模型 文章 1 AlexNet ImageNet Classification with Deep Convolutional Neural Networks 2 VGG Very deep convolutional networks for large-scale image 阅读全文
摘要:
基本原理 欧几里得空间 欧式空间的本质性,是其平面性. 一句话总结:欧几里得空间就是在对现实空间的规则抽象和推广(从n<=3推广到有限n维空间)。 欧几里得几何就是中学学的平面几何、立体几何,在欧几里得几何中,平行线任何位置的间距相等。 而中学学的几何空间一般是2维,3维(所以,我们讨论余弦值、点间 阅读全文
摘要:
代码 exec/compile version_file= 'Path/version.py' def get_version(): with open(version_file,'r') as f: exec(compile(f.read(),version_file,'exec)) return 阅读全文
摘要:
nvidia各型号显卡算力、CUDA、cuDNN、驱动对应版本 表 1:显卡型号信息 表 2:CUDA 工具包和 CUDA 最小版本兼容性所需的最低驱动程序版本 GeForce RTX3090 显卡仅支持CUDA11以上的版本。且Pytorch 1.7.0开始支持CUDA11 GPU与CUDA 查看 阅读全文
摘要:
Ultra-Fast-Lnae-Detectionv2 import torch, os, datetime from utils.dist_utils import dist_print, dist_tqdm, synchronize from utils.factory import get_m 阅读全文
该文被密码保护。 阅读全文
摘要:
OpenMMLab 本随笔规划 前言 安装 MMEngine相关 MMCV相关 ———————————————————————————————————— 必看内容,建议重复阅读,从而加深理解: 欢迎来到 MMEngine 的中文文档! ———————————————————————————————— 阅读全文
摘要:
Windows忘记账号密码(已登录) 以管理员身份打开命令行窗口 net user:查看用户 修改用户密码:net user username password 开启SSH服务 检查是否有SSH服务 确保OpenSSH可用于安装Get-WindowsCapability -Online | ? Na 阅读全文
摘要:
CMake CMake是一个开源、跨平台的工具系列,是用来构建、测试和打包软件。 CMake使用平台无关的配置文件来控制软件编译过程,并生成可在您选择的编译器环境中使用项目文件,比如可以生成vs项目文件或者makefile。CMake工具套件由Kitware公司创建,以满足ITK和VTK等开源项目对 阅读全文
摘要:
常见库全称 cv2 = opencv-python PIL = pillow tqdm argparse 1.pathlib_面向对象的文件系统路径 pathlib 模块提供了表示文件系统路径的类,可适用于不同的操作系统。使用 pathlib 模块,相比于 os 模块可以写出更简洁,易读的代码。pa 阅读全文
摘要:
官方指令文档 自定义环境安装路径 查看环境和环境所在的位置:conda info --envs|conda env list 查看conda的配置信息:conda config --show 展示conda 的所有设置,主要看envs_dirs,表示环境的安装位置。第一个为默认安装路径 修改环境安装 阅读全文
摘要:
声明 此篇内容,只作学习用途,部分内容涉及引用(会标注引用来源) ++++++++++ ++++++++++ ++++++++++ 1. 代码复现过程积累的经验 要看论文的代码实现细节 多卡/单卡训练:多卡就涉及到很多东西,如果你深入了解多卡当我没说。 显卡配置:比如3060支持的CUDA最低11. 阅读全文
摘要:
监督学习 监督学习利用大量的标注数据来训练模型,模型的预测和数据的真实标签产生损失后进行反向传播(计算梯度、更新参数),通过不断的学习,最终可以获得识别新样本的能力。 自监督学习 (Self-Supervised Learning) 是无监督学习的一种,旨在对于无标签数据,通过设计辅助任务(pret 阅读全文
摘要:
回顾: 上篇主要介绍了几种常用的聚类算法,首先从距离度量与性能评估出发,列举了常见的距离计算公式与聚类评价指标,接着分别讨论了K-Means、LVQ、高斯混合聚类、密度聚类以及层次聚类算法。K-Means与LVQ都试图以类簇中心作为原型指导聚类,其中K-Means通过EM算法不断迭代直至收敛,LVQ 阅读全文
摘要:
相关配置 CUDA:12.2 cuDNN:12.X python:3.11 pytorch:对应CUDA12.1 torch相关配置函数 torch.cuda.is_available() //cuda是否可用 torch.cuda.device_count() //查看GPU数量 torch.cu 阅读全文
摘要:
参考 论文名: Global2Local: Efficient Structure Search for Video Action Segmentation "Global2Local:搜寻视频动作分割的有效结构" 作者:Shang-Hua Gao1;Qi Han1;Zhong-Yu Li;Pai 阅读全文
摘要:
参考: git的使用——最全操作流程 GIT常用命令大全——赶紧收藏 极客教程 Git中 fork, clone,branch有什么区别? 快速设置(Github所给) 第一部分描述了如何在命令行上创建一个新的代码仓库(repository): 首先,通过git init初始化一个新的Git仓库。 阅读全文
摘要:
贪心算法 贪心算法总是做出在当前看来事最好的选择。也就是说,贪心算法并不从整体最优上加以考虑,所做的选择只是在某种意义上的局部最优选择。 注:贪心算法不是对所有问题都能得到整体最优解,但对许多问题产生整体最优解,比如最小生成树问题、图的单源最短路径问题等 贪心算法和动态规划的差异 动态规划算法中,每 阅读全文
摘要:
1 阅读全文
摘要:
论文名: MS-TCN++: Multi-Stage Temporal Convolutional Network for Action Segmentation "MS-TCN++: 用于动作分割的多阶段时域卷积" Shi-Jie Li#, Yazan AbuFarha#, Yun Liu, Mi 阅读全文
摘要:
论文名: Adaptive Multi-Lane Detection Based on Robust Instance Segmentation for Intelligent Vehicles 基于鲁棒实例分割的智能车辆自适应多车道检测 关键字: 自适应预测+余弦度量+实例分割+车道线检测。 数据 阅读全文
摘要:
论文介绍 DeepLanes: End-To-End Lane Position Estimation using Deep Neural Networks “DeepLanes:使用深度神经网络的端到端车道位置估计”——2016年 关键字: 深度神经网络+基于相机方法+车道检测 行文结构梳理 1、 阅读全文
摘要:
第一讲.引入 第二讲.数组 阅读全文
摘要:
WSL(Windows Subsystem for Linux)自定义安装路径和卸载部分 安装 WSL 卸载WSL 分发版本 wsl --list :查看安装的版本 wsl --unregister <卸载的发行版>+删掉目录下的子系统 WSL换源 清华源 Anaconda 史上最全最详细的Anac 阅读全文
摘要:
内置函数 sorted() 是 Python 中的一个内置函数,用于对可迭代对象进行排序,并返回一个新的已排序列表。 sorted(iterable, key=key, reverse=reverse) # iterable 是需要排序的可迭代对象,比如列表、元组、字典等。 # key 是一个可选参 阅读全文
摘要:
不是openmim就莫名奇妙安装上了? 首先,mmcv安装文档 其次, pip install -U openmim,安装报错, 尝试换源: pip install -U openmim -i http://pypi.douban.com/simple --trusted-host pypi.dou 阅读全文
摘要:
前言 为什么安装GCC? 搭建CCNet项目时,需要GCC环境 gcc (GCC) 4.8.5 参考: Windows中安装GCC教程-QoSina 第一步:安装MinGW MinGW 点击Install,后续操作连续点击continue 安装完成后,会跳出MinGW Installation Ma 阅读全文
摘要:
论文名: CCNet: Criss-Cross Attention for Semantic Segmentation 语义分割的交叉关注 关键字 语义分割(semantic segmentation)+图注意力+交叉注意力网络+上下文模型 The source codes are availabl 阅读全文
摘要:
对比学习 SimCLRv2 from Google brain team Facebook's MoCo 动作分割 早期的工作大都通过滑动窗口来建模外观和动作的变化状态,因此他们主要关注于短期的依赖关系。之后同时捕捉长期和短期的依赖关系称为了动作分割的焦点。——Global2Local 序列模型,序 阅读全文
摘要:
论文名: Going Deeper with Convolutions 深入了解卷积 了解GoogleNet 研究问题: 研究方法: 主要结论: 模型: 问题: 行文结构梳理: 阅读全文
摘要:
论文名: Ultra Fast Deep Lane Detection with Hybrid Anchor Driven Ordinal Classification 混合Anchor驱动顺序分类的超快深车道检测 研究问题: 1、效率问题:在受限的车辆计算设备下,执行车道检测算法,需要更快的检测速 阅读全文
摘要:
论文名: 研究问题: 研究方法: 主要结论: 模型: 问题: 行文结构梳理: Ctrl+v #论文名: #研究问题: #行文结构梳理: #研究方法: #主要结论: #模型: #问题: 阅读全文
摘要:
论文名: Very deep convolutional networks for large-scale image recognition "用于大规模图像识别的深度卷积网络" 了解VGG模型 VGG在深度上的探索达到了极致,往后的精进在于改进结构 研究问题: 研究方法: 主要结论: 模型: 问 阅读全文
摘要:
第7章 贝叶斯分类器 怎样用非数学语言讲解贝叶斯定理? 感觉像在说贝叶斯公式 带你理解朴素贝叶斯分类算法 将贝叶斯公式诠释为:在特征条件下的分类问题:\(P(类别|特征)=\frac{P(类别)P(特征|类别)}{P(特征)}\) 7.1 贝叶斯决策论 7.2 极大似然估计 如何通俗地理解极大似热估 阅读全文
摘要:
第5章 神经网络 5.1 神经元模型 基本单元:神经元 灵感来源: 生物神经网络(1、当神经元“兴奋”时,向相邻的神经元发送化学物质,从而改变相邻神经元的电位) 激活:如果某个神经元的电位超过了一个“阈值”,那么它就会被激活,即“兴奋”起来,向其他相邻神经元发送化学物质。 图例:McCulloch和 阅读全文
摘要:
第3章 线性模型 3.1 基本形式 问题描述:给定由d个属性描述示例\(x=(x_{1};x_{2};...;x_{d})\),其中\(x_{i}\)是x自第i个属性上的取值,线性模型(Linear model)试图学得一个通过属性的线性组合来进行预测函数,即 函数描述:\(f(x)=w_{1}x_ 阅读全文
摘要:
文献名:ImageNet Classification with Deep Convolutional Neural Networks 创新点: 首次利用AlexNet神经网络,在ImageNet分类中以巨大的优势打败非神经网络算法 模型: 阅读全文