04 2025 档案

摘要:Qwen-2 微调实战 Intro 指令微调 指令微调(Instruction Tuning)是一种针对大型预训练语言模型的微调技术,其核心目的是增强模型理解和执行特定指令的能力,使模型能够根据用户提供的自然语言指令准确、恰当地生成相应的输出或执行相关任务。 指令微调特别关注于提升模型在遵循指令方面 阅读全文
posted @ 2025-04-21 14:19 Miya_Official 阅读(159) 评论(0) 推荐(0)
摘要:Bert 文本情感分类实战 Intro BERT 模型直接下载来自 HuggingFace 上由 Google 发布的 bert-case-uncased 预训练模型。 数据集采用 IMDB(Internet Movie Database Dataset),这是 NLP 领域中一个非常著名和广泛使用 阅读全文
posted @ 2025-04-21 14:08 Miya_Official 阅读(224) 评论(0) 推荐(0)
摘要:Gem5 体系结构实验设计 By. Miya | 2024 前言 笔者在学习 Gem5 时,苦于没有适合的入门教材,后担任体系结构课程助教,设计了此实验。整理于此,供参考交流。 环境搭建 实验平台 Windows 11 Docker Desktop Gem5 Ubuntu 24.04_all_dep 阅读全文
posted @ 2025-04-21 13:25 Miya_Official 阅读(575) 评论(0) 推荐(0)
摘要:ChatGLM-6B 部署/微调 Experimental Setup 参考 [1] [2] [3] [4] 进行实验。加速卡为海光 DCU。 nproc = 8 Core(s) per socket = 32 CPU: 海光 7285 GPU: DCU@16GB DTK Version = v24 阅读全文
posted @ 2025-04-19 11:17 Miya_Official 阅读(104) 评论(0) 推荐(0)
摘要:Mamba × Transformer Durham arxiv Basis State Space Models (SSMs) - Mamba 基础理论,源于控制理论 Mamba - 选择性 SSMs 之一,与 Transformer 在长距离学习上优势互补。 Mamba: 长距离,pixel-w 阅读全文
posted @ 2025-04-18 14:29 Miya_Official 阅读(67) 评论(0) 推荐(0)
摘要:网络结构优化 | LIR UESTC MM’24 针对现有 IR 网络喜欢堆叠基本块、导致参数冗余和不必要计算等问题,提出轻量化的 LIR Baseline 网络。 Basis 一些关键词。 图像评价常用指标 PSNR (峰值信噪比) SSIM (结构相似性) LAA (Lightweight Ad 阅读全文
posted @ 2025-04-18 14:12 Miya_Official 阅读(98) 评论(0) 推荐(0)
摘要:InstructIR JMU ECCV’24 Introduction Image Restoration Such effects are commonly known in low-level computer vision as degradations (退化). IR 是 low-leve 阅读全文
posted @ 2025-04-18 13:47 Miya_Official 阅读(45) 评论(0) 推荐(0)
摘要:Diffusion-based | GSDM SEU AAAI’24 一篇基于 Diffusion 的针对文本图像恢复(场景文本 STR + 手写文本 HTR)的文章。 Methodology Overview GSDM 由 SPM + RM 构成,如图所示 其中 Input: \(c \in \m 阅读全文
posted @ 2025-04-18 12:15 Miya_Official 阅读(42) 评论(0) 推荐(0)
摘要:开山作 | Context Encoder UCB CVPR’16 Basis 独立评估了编码器和解码器 通过微调 Encoder,该工作可被用于多种图像理解任务,如分类、目标检测、语义分割 提到,该工作是首个参数化的语义填充算法 提到,该工作可被作为一个视觉特征,用于在非参数化方法中计算近邻(?) 阅读全文
posted @ 2025-04-18 12:02 Miya_Official 阅读(31) 评论(0) 推荐(0)
摘要:OCTUF CUHK CVPR’23 Proposed Method Overall Arch 近端梯度下降 (proximal gradient descent, PGD) 用于求解线性反问题的常用方法。该方法带有 惯性项 (inertial term) 更易收敛到最优。 OCTUF 更新步骤如下 阅读全文
posted @ 2025-04-18 11:51 Miya_Official 阅读(51) 评论(0) 推荐(0)
摘要:CSNet+ HIT TIP 2020 Architecture Overview Highlights: end-to-end mapping encoder-decoder block-based compressed sensing (BCS) non-overlapping. 3 stage 阅读全文
posted @ 2025-04-18 11:44 Miya_Official 阅读(81) 评论(0) 推荐(0)
摘要:AMP-Net UESTC TIP 2021 Introduction 再次提到 “structureinducing regularizers” (结构诱导的正则化项) 如某些变换域的稀疏性、低秩等。 再次提到压缩感知重建是求解一个欠定的线性逆系统 (under-determined linear 阅读全文
posted @ 2025-04-18 03:42 Miya_Official 阅读(95) 评论(0) 推荐(0)
摘要:ISTA-Net KAUST CVPR’18 Introduction 利用信号固有的冗余性,CS 策略可以边采样边压缩,相较于传统 JPEG 技术等“先采样后压缩”策略,节省带宽和存储空间 CS 证明,只要信号在某些变换域中表现出 稀疏性 (sparsity),则可以用比 Nyquist 采样定理 阅读全文
posted @ 2025-04-18 01:58 Miya_Official 阅读(287) 评论(0) 推荐(1)