有一部分没写完,或者写得不好,有时间会完善,故没有公开,有需要私信我 

深度学习理论基础 与 代码实践

 

 

 

 

 

模型训练 tricks 总结

 

 

 

目标检测(1)-R-CNN 

目标检测(2)-SPPNet

目标检测(3)-Fast R-CNN 

目标检测(4)-Faster RCNN

目标检测(5)-faster rcnn 生成 anchor 的过程 解析

 

目标检测(6)-Yolo v1

目标检测(7)-Yolo v2

目标检测(8)-Yolo v3

目标检测(9)-Yolo v4

目标检测(10)-Yolo v5

 

目标检测 - RetinaNet 与 focal loss

目标检测-mAP50、mAP50-95等

 

标注工具

深度学习各 数据集 简介

使用GPU服务器搭建Pytorch并训练YOLO v3数据集

Yolo v3 预训练

yolov3 在VOC、COCO 数据集上的训练,VOC转YOLO格式

 

label smoothing

迁移学习

膨胀卷积-空洞卷积-Dilated Convolution

MobileNet V1 V2

图像风格迁移

图像超分辨率重建 - SRCNN

生成对抗网络 - GAN

 

行为识别【1】

行为识别【2】- 光流法

行为识别 - Two Stream 双流法

行为识别【3】 - CNN + LSTM

行为识别【4】 - 3Dcnn 

行为识别【5】- slowfast

视频数据预处理-UCF101为例

 

 

图像检索【】-传统方法之 BoW简介

图像检索【】-DELF 

图像检索【】-DELG

 

图像检索【】-DOLG

 

图像检索 实战 Fine-tuning CNN Image Retrieval with No Human Annotation

 

 

 

 

细粒度图像分类【1】概述

细粒度图像分类【2】-双线性模型 及 bilinear cnn

细粒度图像分类【3】NTS:Learning to Navigate for Fine-grained Classification

细粒度图像分类【4】十二猫分类,对比ResNet和ViT两者模型性能

细粒度图像检索 SCDA:Selective Convolutional Descriptor Aggregation for Fine-Grained Image Retrieval

 

细粒度图像【引用】– Fine-Grained Image Papers, Codes and Datasets

 

 

全局平均池化 

Gem Pooling

 

激活函数

 

损失函数汇总 及 Pytorch用法汇总(迁移中)

 

一些特殊场景的损失函数

 

 

OCR原理及应用实现

OCR工具 - tesseract

百度 OCR实现pdf文本识别

PaddleOCR-版面分析与表格识别

 

 

 

 

模型加速【1】入门篇

模型加速【2】-知识蒸馏 代码

深度学习 之 模型部署【1】-基础入门

深度学习 之 模型部署【2】-TensorRT 入门 

深度学习 之 模型部署【3】-ONNX 入门

深度学习 之 模型部署【4】-libtorch入门 - pytorch部署torchscript 以及 c++ libtorch 调用 pytorch 模型 

模型部署翻车记:pytorch转onnx踩坑实录

GPU【1】-基础用法 及 性能分析

GPU【2】-用法进阶

GPU【3】-不同版本tensorflow对GPU资源占用

GPU-多GPU训练加速

 

 

MTCNN - 人脸检测

MTCNN - ohem

 

FaceNet and triplets loss

faiss

 

人脸识别 流程 

 

开源工具mediapipe【1】-简介

开源工具mediapipe【2】-手势识别及应用

开源工具mediapipe【3】结合 Yolov5 进行多人姿态估计 

 

dlib系列【1】-入门及人脸基础应用

dlib系列【2】-目标跟踪

dlib系列【3】-目标检测 训练自己的数据

dlib系列【4】-imutils 获取脸部部位 及 扩展检测(如 虹膜检测、眨眼检测等)

 

face_recognition 人脸识别

 

 

注意力机制【1】-入门篇

注意力机制【2】-CV中的注意力机制 

注意力机制【3】-Self Attention

注意力机制【4】-多头注意力机制

注意力机制【5】Scaled Dot-Product Attention 和 mask 

注意力机制【6】-transformer 和 Positional Encoding 

 

Vision Transformer(ViT)

 

transformers库-基本应用

transformers库-tokenizer分词器

transformers库-BERT中的Tokenizer 

hugging face

transformers库-cv应用简介

transformers库-优化器

feature map 的理解与处理

feature map-opencv实现特征热力图可视化

feature map-钩子hook和CAM可视化 

feature map 可视化【3】-可视化VIT中的注意力 

 

 

 

PyTorch下的可视化工具(网络结构/训练过程可视化)

 

 
 

yaml 文件

文件系统 及 操作汇总

NLP 学习笔记

     

 

NLP基础知识汇总 

 

词云 绘制总结

word2vec

Word Embedding 实现 文本分类

信息抽取

Bert【1】-基础

Bert【2】-应用

Bert【3】 详解

 

GPT

 

 

hugging face

txtai系列教程

封神榜科技成果

 

 

大语言模型一览

ChatYuan

用于生成程序代码的大型语言模型

chatglm

 

 

langchain-入门指南

langchain-使用教程 

langchain-结合LLM实现本地知识库

 

最优化算法 学习笔记      

线性规划

遗传算法-总体框架

遗传算法-选择算子

遗传算法-编码

遗传算法-目标函数与适应度函数变换

模拟退火算法简介

粒子群算法 PSO【1】- 基本原理

蚁群算法【1】基本原理

蚁群算法【2】 优化方法

启发算法 - 汇总篇 

优化问题-实战经验 

车辆路径规划问题分类

 

大规模邻域搜索 - 代码 变邻域搜索 - 代码禁忌搜索算法 - 代码 

其他蜣螂算法

 

【引】智能优化算法汇总

 

 机器学习 笔记      

朴素贝叶斯

决策树-缺失值处理

决策树-回归

支持向量机 SVM

从 回归(简述) 到 广义线性模型

集成学习-简介

集成学习-提升树

集成学习-梯度提升树

集成学习-组合策略与Stacking 

集成学习-Adaboost

集成学习-Adaboost 参数选择

集成学习-Adaboost 进阶

集成学习-xgboost

集成学习-Boosting 模型深度串讲 

softmax与多分类

激活函数 

损失函数汇总 及 Pytorch用法汇总(迁移中)

二分类实现多分类 

分类 - 模型评估 

类别不均衡

伪标签 解决 小数据集问题

 

缺失值处理

数据规范化

数据编码

特征选择

神经网络-初始化参数

训练测试样本划分

参数优化-学习曲线

参数优化-验证曲线

参数优化-API

参数优化-偏差与方差

吴恩达读书笔记【1】-偏差与方差 

吴恩达读书笔记【2】-学习曲线

吴恩达读书笔记【3】-基于不同分布数据的模型

吴恩达读书笔记【4】-调试推理算法 

吴恩达读书笔记【5】-流水线与端到端

某次使用随机森林的总结  

层次聚类

DBSCAN 

Mean shift 【1】- 基本原理 

模糊 C 均值聚类 FCM

图像分割 - KMeans 实现

kmeans 聚类 k 值优化

EM 算法(一)-原理 

EM 算法(二)-KMeans

EM 算法(三)-GMM

KL 散度(相对熵)

beta 分布 

概率分布汇总 

核函数 <-- 内积 <-- 余弦相似 

 动态时间规整-DTW简介  
CLIQUE - 子空间聚类算法       

卡尔曼滤波 

中值滤波 - 进阶篇 

  LDA 线性判别分析   
时间序列 - 平稳性与差分      
   

OpenCV 学习笔记

 

 

 

 

 

 

 

 

 

 

 

 

OpenCV4 傅里叶变换 实现 滤波 锐化 等

OpenCV4 伪色彩

 

OpenCV-LUT调色

OpenCV4【6】-颜色空间

 

cv2PIL

 

 

 

 

图像预处理-汇总篇

图像处理-gamma 矫正 及 人脸处理

 

图像 缩放 letterbox_image

 

图像相似性 - 图像查重

 

论文记录 - _基于直方图均衡的夜间图像增强算法研究