DL - 随笔分类 - dctwan

Diffusion Model理解

摘要：Diffusion Model理解整体理解从右向左是正向过程，\(q(x_t|x_{t-1})\) 是加噪声的过程，可以直接获知，\(q(x_{t-1}|x_t)\) 是我们想要做的建楼操作，需要通过训练模型\(p_\theta(x_{t-1}|x_t)\) 来估计 Weng, Lilian. 阅读全文

posted @ 2024-01-03 09:41 dctwan 阅读(341) 评论(0) 推荐(0)

sklearn入门

摘要：[toc] 本文目的是认识sklearn库的一些基本概念，了解sklearn提供的常用功能。 # 官方网站 * Getting Start：https://scikit-learn.org/stable/getting_started.html * sklearn主页：https://scikit- 阅读全文

posted @ 2023-08-30 15:42 dctwan 阅读(113) 评论(0) 推荐(0)

Latent Diffusion Model初体验

摘要：目录源码拷贝虚拟环境VSCode带命令行参数运行py文件txt2imgimg2img问题记录此方式在服务器（Ubuntu）上安装Stable Diffusion，使用miniconda虚拟环境。在Windows10系统上使用VScode远程开发方法进行调试和运行。注意：使用VSCode连接服务器阅读全文

posted @ 2023-08-09 19:31 dctwan 阅读(891) 评论(0) 推荐(0)

Vision Transformer

摘要：

**Vision Transformer** 本文关注ViT论文`4.5 Inspecting Vision Transformer`可视化的原理及实现，此外还对ViT pytorch源码实现进行理解 [toc] # Introduction [论文地址](arXiv:2010.11929) ## 阅读全文

posted @ 2023-07-27 11:12 dctwan 阅读(1057) 评论(0) 推荐(1)

transformer

摘要：arXiv:1706.03762 # 1. 问题提出全连接神经网络（FCN），可以很好的处理输入为1个向量（特征向量）的情况，但是如果输入是一组向量，FCN处理起来不太方便以词性标记的问题为例对于处于同一个句子中的相同的2个单词`saw`，词性不同，前者为动词（V），后者为名词（N）如果尝试阅读全文

posted @ 2023-07-11 08:08 dctwan 阅读(47) 评论(0) 推荐(0)

RNN

摘要：Recurrent Neural Network（RNN） # 1.问题提出想要对一个句子中的单词，对其语义进行标记，如下两个句子，相同单词`Taipei`，在第1句中的语义是目的地（dest），在第2个句子中的语义是出发地（place of departure）对于句子输入问题，可以将单词转变阅读全文

posted @ 2023-05-29 15:07 dctwan 阅读(58) 评论(0) 推荐(0)

Diffusion Model

摘要：# 1. 概述图像生成任务：给定一段文字，模型根据文字描述产生图片 ## 1.1 图像生成方式 * 一次生成一个pixel 像Transformer接龙那样，一次生成一个pixel，然后作为下一个pixel的输入，这样依次生成一张图像的所有pixel * 一次生成整张图片的所有pixel 每一个p 阅读全文

posted @ 2023-05-25 11:19 dctwan 阅读(157) 评论(0) 推荐(0)

Test Time Augmentation

摘要：# 1.概念 ## 1.1 数据增强 Data Augmentation，训练过程中经常使用数据增强技术 > 大型数据集是成功应用深度神经网络的先决条件。图像增广在对训练图像进行一系列的随机变化之后，生成相似但不同的训练样本，从而**扩大了训练集的规模**。此外，应用图像增广的原因是，**随机改阅读全文

posted @ 2023-05-24 17:03 dctwan 阅读(374) 评论(0) 推荐(0)

vscode配置远端服务器深度学习项目

摘要：vscode配置远端服务器深度学习项目 # 1.安装vscode 官网地址：https://code.visualstudio.com/ 下载安装程序，运行安装即可 # 2.连接服务器 ## 2.1 安装相关插件需要安装 `Remote - SSH` 和 `Remote Development` 阅读全文

posted @ 2023-05-22 16:01 dctwan 阅读(537) 评论(0) 推荐(0)

Recurrent Neural Network（RNN）

摘要：1.问题提出想要对一个句子中的单词，对其语义进行标记，如下两个句子，相同单词Taipei，在第1句中的语义是目的地（dest），在第2个句子中的语义是出发地（place of departure）对于句子输入问题，可以将单词转变为一个向量，再进行输入尝试使用神经网络处理这个问题，但对于相同的输阅读全文

posted @ 2023-05-18 09:37 dctwan 阅读(76) 评论(0) 推荐(0)

性能度量

摘要：错误率与精度常用于分类问题错误率精度查准率、查全率与F~β~ 混淆矩阵以二分类为例，T：True，预测正确；F：False，预测错误；P：Positive，正样本；N：Negative，负样本 TP True Positive，正确预测样本为正，实际就是正样本 FP False Posit 阅读全文

posted @ 2023-05-12 09:57 dctwan 阅读(51) 评论(0) 推荐(0)

HW2：classification

摘要：HW2 任务描述音位分类预测（Phoneme classification），我们有音频->音位这样的训练数据，想要训练一个模型，学习这样的对应关系，然后给定音频，预测其音位音位音位（phoneme），是人类某一种语言中能够区别意义的最小语音单位，是音位学分析的基础概念。每种语言都有一套自己的阅读全文

posted @ 2023-04-24 08:40 dctwan 阅读(117) 评论(0) 推荐(0)

Gradient Descent

摘要：Learning Rate 关于lr的问题 lr太小模型收敛的很慢，时间开销大 lr太大每次更新参数步子迈的很大，容易越过最优解我们追求的是红色的情况动态调整lr 基本原则：先大再小在训练开始时，此时我们距离最优解还较远，lr可以设置稍大些，以较快的速度接近最优解。在训练的后期，此时我们已阅读全文

posted @ 2023-04-23 15:47 dctwan 阅读(62) 评论(0) 推荐(0)

HW1：regression

摘要：HW1：Regression 任务描述新冠检测预测：根据前4天的特征和核酸检测结果，预测第5天的核酸检测结果为阳性的可能性数据两个文件covid.train.csv和covid.test.csv train 2699x118，2699个样本，每个样本的118维特征包括 1：id，样本编号 37 阅读全文

posted @ 2023-04-20 16:03 dctwan 阅读(70) 评论(0) 推荐(0)

numpy & pandas学习

摘要：numpy & pandas 介绍 & 安装 numpy 和 pandas 用于数据分析/处理 numpy基于C语言，pandas基于numpy，相比于python的字典/或列表，可以较快实现矩阵计算 numpy numpy的属性 ndim 矩阵的维度 shape 矩阵的形状（行-列） size 矩阅读全文

posted @ 2023-04-18 15:42 dctwan 阅读(41) 评论(0) 推荐(0)

李宏毅机器学习——pytorch

摘要：什么是pytorch python机器学习框架，Facebook提出，主要有一下两个特点使用GPU加速高维矩阵的运算 torch.cuda.is_available() x = x.to('cuda') 可以很方便的实现梯度的计算 requires_grad=True指定需要对变量x计算梯度 z是阅读全文

posted @ 2023-04-16 10:22 dctwan 阅读(241) 评论(0) 推荐(0)

数据集区分

摘要：数据集区分参考：11 模型选择 + 过拟合和欠拟合【动手学深度学习v2】_哔哩哔哩_bilibili 训练数据集相当于平时作业题/练习题，用来训练模型（梯度下降更新权重、偏置最小化代价函数）验证数据集相当于模拟考试，用来调参（超参数：learning rate、batch size）测试数阅读全文

posted @ 2023-02-07 15:18 dctwan 阅读(38) 评论(0) 推荐(0)

损失函数

摘要：损失函数参考： “损失函数”是如何设计出来的？直观理解“最小二乘法”和“极大似然估计法”_哔哩哔哩_bilibili “交叉熵”如何做损失函数？打包理解“信息量”、“比特”、“熵”、“KL散度”、“交叉熵”_哔哩哔哩_bilibili 最小二乘法所谓最小即梯度下降要找到使得损失函数最小的参数W和阅读全文

posted @ 2023-02-07 09:50 dctwan 阅读(144) 评论(0) 推荐(0)

正则化技术

摘要：正则化技术 # 1.过拟合正则化技术用来防止过拟合。所谓过拟合即训练过程中，训练集上的误差持续减少，而与此同时测试集上的误差增大的现象。目标是追求模型对于没有见过的数据的预测效果（即泛化能力），而不是追求完全拟合训练数据防止过拟合的方法 * 获取更多的数据 * 选择更合适的网络模型 * 早停阅读全文

posted @ 2023-02-05 11:56 dctwan 阅读(171) 评论(0) 推荐(0)

Batch Normalization

摘要：参考：【深度学习李宏毅】 Batch Normalization （中文）bilibili 7.5. 批量规范化 — 动手学深度学习 2.0.0 documentation (d2l.ai) 3.6 Batch Norm 为什么奏效？- 吴恩达_bilibili 《Batch Normaliz 阅读全文

posted @ 2023-02-03 21:29 dctwan 阅读(82) 评论(0) 推荐(0)

dctwan

随笔分类 - DL

公告