AI综合 - 第41页 - 网站分类

umich cv-6-2 注意力机制

这节课中介绍了循环神经网络的第二部分，主要引入了注意力机制，介绍了注意力机制的应用以及如何理解，在此基础上建立了注意力层以及transformer架构注意力机制注意力机制应用与理解注意力层 transformer 注意力机制上次我们没有提到sequence to sequence的RNN结 ...

umich cv-6-1 循环神经网络基本知识

这节课中介绍了循环神经网络的第一部分，主要介绍了循环神经网络的基本概念，vanilla循环网络架构，RNN的一些应用，vanilla架构的问题，更先进的rnn架构比如GRU和LSTM 循环神经网络基本知识 vanilla循环网络架构应用与理解 vanilla架构的问题 LSTM vanilla循环 ...

全面掌握胶囊网络：从基础理论到PyTorch实战

本文全面深入地探讨了胶囊网络（Capsule Networks）的原理、构建块、数学模型以及在PyTorch中的实现。通过本文，读者不仅能够理解胶囊网络的基础概念和高级数学原理，还能掌握其在实际问题中的应用方法。关注TechLead，分享AI与云服务技术的全维度知识。作者拥有10+年互联网服务架构 ...

ResNet详解：网络结构解读与PyTorch实现教程

本文深入探讨了深度残差网络（ResNet）的核心概念和架构组成。我们从深度学习和梯度消失问题入手，逐一解析了残差块、初始卷积层、残差块组、全局平均池化和全连接层的作用和优点。文章还包含使用PyTorch构建和训练ResNet模型的实战部分，带有详细的代码和解释。关注TechLead，分享AI与云服 ...

umich cv-5-2 神经网络训练2

这节课中介绍了训练神经网络的第二部分，包括学习率曲线，超参数优化，模型集成，迁移学习训练神经网络2 学习率曲线超参数优化模型集成迁移学习学习率曲线在训练神经网络时，一个常见的思路就是刚开始迭代的时候学习率较大，然后随着迭代次数的增加，学习率逐渐下降，下面我们就来介绍几种学习率下降的方法： ...

umich cv-5-1 神经网络训练1

这节课中介绍了训练神经网络的第一部分，包括激活函数的选择，权重初始化，数据预处理以及正则化方法训练神经网络1 激活函数数据预处理权重初始化正则化方法激活函数这部分主要讨论我们之前提到的几种激活函数的利弊：首先我们看sigmoid函数，这种激活函数有着激活函数中常见的优点与缺点：优点方 ...

自编码器AE全方位探析：构建、训练、推理与多平台部署

本文深入探讨了自编码器（AE）的核心概念、类型、应用场景及实战演示。通过理论分析和实践结合，我们详细解释了自动编码器的工作原理和数学基础，并通过具体代码示例展示了从模型构建、训练到多平台推理部署的全过程。关注TechLead，分享AI与云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产 ...

一文搞懂深度信念网络！DBN概念介绍与Pytorch实战

本文深入探讨了深度信念网络DBN的核心概念、结构、Pytorch实战，分析其在深度学习网络中的定位、潜力与应用场景。关注TechLead，分享AI与云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师 ...

【羚珑AI智绘营】分分钟带你拿捏SD中的色彩控制

颜色控制一直是AIGC的难点，prompt会污染、img2img太随机… 今天带来利用controlnet，实现对画面颜色的有效控制。都说AIGC是抽卡，但对把它作为工具而非玩具的设计师，必须掌握如何控制它，让我们一起开始可控AI生成。 ...

用AI打造一个属于自己的歌手，让她C位霸气出道

一、前言今天玩儿点儿特别的，AI大行其道的今天，还没玩过AI模型的程序员绝对不是个好厨子。我本人比较喜欢音乐，但是一直没有出道，很是遗憾。那么今天，我就使用AI模型亲手打造一个堪比真人的歌手，让她C位霸气出道。首先，让这位女歌手露一嗓子：点我试听唱的还不错吧，接下来咱们来分析这位歌手是如何 ...

解密长短时记忆网络（LSTM）：从理论到PyTorch实战演示

本文深入探讨了长短时记忆网络（LSTM）的核心概念、结构与数学原理，对LSTM与GRU的差异进行了对比，并通过逻辑分析阐述了LSTM的工作原理。文章还详细演示了如何使用PyTorch构建和训练LSTM模型，并突出了LSTM在实际应用中的优势。关注TechLead，分享AI与云服务技术的全维度知识。 ...

Lora升级！ReLoRa！最新论文 High-Rank Training Through Low-Rank Updates

关注公众号TechLead，分享AI与云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师，项目管理专业人士，上亿营收AI产品研发负责人。摘要尽管通过扩展导致具有数千亿参数的大型网络在统治和效率方面 ...

Windows 95 的辉煌诞生历史

1992 年 2 月，Windows 3.1 的研发即将结束，而 Windows 团队正忙得不亦乐乎地计划他们的下一盘大棋。到了 3 月 5 日，他们终于悠哉悠哉地敲定了战略大计：横扫桌面、笔记本、移动设备以及时髦的触控笔设备。至于那些高大上的服务器和工作站？呵呵，那自然是留给了 NT 团队。此外， ...

从基础到实践，回顾Elasticsearch 向量检索发展史

本文将回顾 Elasticsearch 向量检索的发展历史，重点介绍各个阶段的特点和进展。以史为鉴，方便大家建立起 Elasticsearch 向量检索的全量认知。 ...

ChatGPT是如何产生心智的？

一、前言 - ChatGPT真的产生心智了吗？来自斯坦福大学的最新研究结论，一经发出就造成了学术圈的轰动，“原本认为是人类独有的心智理论（Theory of Mind，ToM），已经出现在ChatGPT背后的AI模型上”。所谓心智理论，就是理解他人或自己心理状态的能力，包括同理心、情绪、意图等。这 ...

umich cv-4-2 经典卷积网络架构

这节课中主要讨论了卷积神经网络的发展历史以及几种经典结构是如何构建的卷积网络经典结构 AlexNet VGG GoogleNet Residual Network AlexNet 在2012年的时候，Alexnet神经网络提出，这时网络的架构比如说各个层之间要如何排列组合，使用多少卷积层池化层，每 ...

记一次服务器Cuda驱动崩溃修复过程

基本过程今天实验室师兄在服务器运行深度学习训练时候得到报错CUDA initialization: Unexpected error from cudaGetDeviceCount()疑似Cuda与NVIDIA显卡驱动沟通中出现了问题，使用nvidia-smi指令时提示Failed to init ...

umich cv-4-1 卷积网络基本组成部分介绍

这节课中介绍了卷积网络的基本组成部分(全连接层，激活函数，卷积层，池化层，标准化等)，下节课讨论了卷积神经网络的发展历史以及几种经典结构是如何构建的卷积网络组成部分前言卷积层池化层 normalization 前言在之前提到的全连接神经网络中，我们直接把一个比如说32 * 32 * 3的图 ...

umicv cv-summary1-全连接神经网络模块化实现

全连接神经网络模块化实现 Linear与Relu单层实现 LossLayer实现多层神经网络不同梯度下降方法 Dropout层今天这篇博文针对Assignment3的全连接网络作业，对前面学习的内容进行一些总结在前面的作业中我们建立神经网络的操作比较简单，也不具有模块化的特征，在A3作业中， ...

多模态 GPT-V 出世！36 种场景分析 ChatGPT Vision 能力，LMM 将全面替代大语言模型？

LMM将会全面替代大语言模型？人工智能新里程碑GPT-V美国预先公测，医疗领域/OCR实践+166页GPT-V试用报告首发解读 ...