摘要: 使用Pytorch手把手搭建一个Transformer网络结构并完成一个小型翻译任务。 首先,对Transformer结构进行拆解,Transformer由编码器和解码器(Encoder-Decoder)组成,编码器由Multi-Head Attention + Feed-Forward Netwo 阅读全文
posted @ 2024-10-12 21:01 iSherryZhang 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 其中,Transformer和BERT来自Google,GPT系列【GPT、GPT-1、GPT-2、GPT-3、ChatGPT、GPT-4】来自OpenAI。 GPT Paper名为Improving Language Understanding by Generative Pre-Training 阅读全文
posted @ 2023-03-28 20:51 iSherryZhang 阅读(1707) 评论(3) 推荐(2) 编辑
摘要: Transformer Transformer是完全由Attention和Self-Attention结构搭建的深度神经网络结构。 其中最为重要的就是Attention和Self-Attention结构。 Attention结构 Attention Layer接收两个输入$X = [x_1, x_2 阅读全文
posted @ 2023-03-21 18:10 iSherryZhang 阅读(309) 评论(0) 推荐(0) 编辑
摘要: Transformer在NLP任务中表现很好,但是在CV任务中应用还很有限,基本都是作为CNN的一个辅助,Vit尝试使用纯Transformer结构解决CV的任务,并成功将其应用到了CV的基本任务--图像分类中。 因此,简单而言,这篇论文的主旨就是,用Transformer结构完成图像分类任务。 图 阅读全文
posted @ 2023-02-27 14:28 iSherryZhang 阅读(640) 评论(0) 推荐(1) 编辑
摘要: 基于Stable Diffusion的哪些图像操作们: Text-To-Image generation:StableDiffusionPipeline Image-to-Image text guided generation:StableDiffusionImg2ImgPipeline In-p 阅读全文
posted @ 2023-02-24 11:17 iSherryZhang 阅读(3310) 评论(0) 推荐(0) 编辑
摘要: diffusers库的目标是: 将扩散模型(diffusion models)集中到一个单一且长期维护的项目中 以公众可访问的方式复现高影响力的机器学习系统,如DALLE、Imagen等 让开发人员可以很容易地使用API进行模型训练或者使用现有模型进行推理 diffusers的核心分成三个组件: P 阅读全文
posted @ 2023-02-23 11:36 iSherryZhang 阅读(14031) 评论(0) 推荐(0) 编辑
摘要: Diffusion相关技术最近也是非常火爆,看看招聘信息,岗位名称都由AI算法工程师变成了AIGC算法工程师,本周跟大家分享一些Diffusion算法相关的内容。 Window10环境下,Stable Diffusion的本地部署与效果展示 我选用的版本是: 在Windows下安装部署,只需要: I 阅读全文
posted @ 2023-02-13 17:21 iSherryZhang 阅读(3373) 评论(0) 推荐(0) 编辑
摘要: 在Python的使用中,我们经常会遇到这样的函数定义: def my_func(x, y, *args, **kwargs): for arg in args: print(arg) for key, value in kwargs.items(): print(f"{key}: {value}") 阅读全文
posted @ 2023-04-10 11:00 iSherryZhang 阅读(158) 评论(0) 推荐(0) 编辑
摘要: Python类 Python类的设计原则 封装(Encapsulation):Python类被设计用来将相关数据和行为封装到一个独立的单元中。 继承(Inheritance):Python支持继承,允许子类从父类继承属性和方法。有利于代码的复用和创建相关类的层次结构。 多态(Polymorphism 阅读全文
posted @ 2023-04-06 17:48 iSherryZhang 阅读(447) 评论(0) 推荐(2) 编辑
摘要: 155. 最小栈 设计一个支持 push ,pop ,top 操作,并能在常数时间内检索到最小元素的栈。 实现 MinStack 类: MinStack() 初始化堆栈对象。 void push(int val) 将元素val推入堆栈。 void pop() 删除堆栈顶部的元素。 int top() 阅读全文
posted @ 2023-03-31 20:03 iSherryZhang 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 目录一、OpenCV简介1.1 OpenCV是什么1.2 安装及使用二、图像的基础2.1 成像原理2.2 图像格式2.3 颜色空间三、OpenCV基础操作3.1 图像的读取、显示、保存3.2 通道转换三、OpenCV常见图像处理3.1 在图像上绘制几何图像及添加文字3.2 图像的几何变换3.3 图像 阅读全文
posted @ 2023-03-30 20:40 iSherryZhang 阅读(845) 评论(0) 推荐(1) 编辑
摘要: 14. 最长公共前缀 编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀,返回空字符串 ""。 输入:strs = ["flower","flow","flight"] 输出:"fl" 思路解析 string longestCommonPrefix(vector<string>& s 阅读全文
posted @ 2023-03-24 17:17 iSherryZhang 阅读(86) 评论(0) 推荐(0) 编辑
摘要: Seq2Seq + Attention Seq2Seq模型,有一个Encoder和一个Decoder,默认认为Encoder的输出状态h_m包含整个句子的信息,作为Decoder的输入状态s_0完成整个文本生成过程。这有一个严重的问题就是,最后的状态不能记住长序列,也就是会遗忘信息,那么Decode 阅读全文
posted @ 2023-03-17 22:16 iSherryZhang 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 88. 合并两个有序数组 给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目。 请你 合并 nums2 到 nums1 中,使合并后的数组同样按 非递减顺序 排列。 注意:最终,合并后数组不应由函数返回, 阅读全文
posted @ 2023-03-17 16:55 iSherryZhang 阅读(105) 评论(0) 推荐(0) 编辑