05 2023 档案
摘要:矩阵向量求导 # 1. 定义法求导 ## 1.1 标量对向量求导 实值函数**对向量的每个分量求导** ## 1.2 标量对矩阵求导 实值函数**对矩阵的每个分量求导** ## 1.3 向量对向量求导 **分子向量的每一个分量对分母向量求导,也就是转换成多个标量对向量求导** 2.矩阵微分求导 3.
阅读全文
摘要:实际优化问题的目标函数往往比较复杂。为了使问题简化,通常将目标函数在某点附近展开为泰勒(Taylor)**多项式来逼近原函数** 一元函数在处的泰勒展开式为 $$ f(x)=f(x_k)+(x-x_k)f^\prime(x_k)+\frac{1}{2!}(x-x_k)^2f^{
阅读全文
摘要:# 1. 相关概念 * 优化 改变**x**以最大化、最小化某个函数f(**x**)的任务 * 目标函数、准则、代价函数、损失函数、误差函数 最大化、最小化的函数 * 用*****上标表示最大化最小化函数的**x**的值 # 2. 梯度下降 ## 2.1
阅读全文
摘要:信息论 是概率论的延申,在机器学习领域,用于 * 构造目标函数 * 对算法进行理论分析和证明 # 1.熵 > 熵衡量了一个概率分布的随机性程度,或者说它包含的信息量的大小。 随机变量X取值为x的概率为p(x),p(x)很小,而这个事件又发生了,则包含的信息量大。用h(x)表示信息量的大小,则h(x)
阅读全文
摘要:Recurrent Neural Network(RNN) # 1.问题提出 想要对一个句子中的单词,对其语义进行标记,如下两个句子,相同单词`Taipei`,在第1句中的语义是目的地(dest),在第2个句子中的语义是出发地(place of departure) 对于句子输入问题,可以将单词转变
阅读全文
摘要:# 1. 概述 图像生成任务:给定一段文字,模型根据文字描述产生图片 ## 1.1 图像生成方式 * 一次生成一个pixel 像Transformer接龙那样,一次生成一个pixel,然后作为下一个pixel的输入,这样依次生成一张图像的所有pixel * 一次生成整张图片的所有pixel 每一个p
阅读全文
摘要:简单来说,Screen是一个可以在多个进程之间多路复用一个物理终端的窗口管理器。Screen中有会话的概念,用户可以在一个screen会话中创建多个screen窗口,在每一个screen窗口中就像操作一个真实的telnet/SSH连接窗口那样。 1.创建screen ```shell screen
阅读全文
摘要:# 1.概念 ## 1.1 数据增强 Data Augmentation,训练过程中经常使用数据增强技术 > 大型数据集是成功应用深度神经网络的先决条件。 图像增广在对训练图像进行一系列的随机变化之后,生成相似但不同的训练样本,从而**扩大了训练集的规模**。 此外,应用图像增广的原因是,**随机改
阅读全文
摘要:vscode配置远端服务器深度学习项目 # 1.安装vscode 官网地址:https://code.visualstudio.com/ 下载安装程序,运行安装即可 # 2.连接服务器 ## 2.1 安装相关插件 需要安装 `Remote - SSH` 和 `Remote Development`
阅读全文
摘要:1.问题提出 想要对一个句子中的单词,对其语义进行标记,如下两个句子,相同单词Taipei,在第1句中的语义是目的地(dest),在第2个句子中的语义是出发地(place of departure) 对于句子输入问题,可以将单词转变为一个向量,再进行输入 尝试使用神经网络处理这个问题,但对于相同的输
阅读全文
摘要:错误率与精度 常用于分类问题 错误率 精度 查准率、查全率与F~β~ 混淆矩阵 以二分类为例,T:True,预测正确;F:False,预测错误;P:Positive,正样本;N:Negative,负样本 TP True Positive,正确预测样本为正,实际就是正样本 FP False Posit
阅读全文