晓飞的算法工程笔记

2024年11月29日

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: Improving Object Detection via Local-global Contrastive Learning 论文地址：https://arxiv.org/abs/2410.05058 论文代码：https://local 阅读全文

posted @ 2024-11-29 09:40 晓飞的算法工程笔记阅读(202) 评论(0) 推荐(0) 编辑

2024年11月28日

SSD：清华出品，可切换密集稀疏的大模型预训练加速方案 | ICML'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: Exploring the Benefit of Activation Sparsity in Pre-training 论文地址：https://arxiv.org/abs/2410.03440 论文代码：https://github.co 阅读全文

posted @ 2024-11-28 09:35 晓飞的算法工程笔记阅读(183) 评论(0) 推荐(0) 编辑

2024年11月25日

CritiCS：智能协作下的创意长篇故事生成框架 | EMNLP'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: Collective Critics for Creative Story Generation 论文地址：https://arxiv.org/abs/2410.02428 创新点提出了 \({\tt CritiCS}\) 的框架，旨在通过阅读全文

posted @ 2024-11-25 09:32 晓飞的算法工程笔记阅读(111) 评论(0) 推荐(0) 编辑

2024年11月22日

Pcb-Merging：无需训练的多任务模型合并方案 | NeurIPS'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: Parameter Competition Balancing for Model Merging 论文地址：https://arxiv.org/abs/2410.02396 论文代码：https://github.com/duguodong 阅读全文

posted @ 2024-11-22 09:21 晓飞的算法工程笔记阅读(126) 评论(0) 推荐(0) 编辑

2024年11月21日

Open-RAG：将开源LLM模型集成为高效RAG模型 | ENMLP'24

摘要：本文是对公开论文的核心提炼，旨在进行学术交流。如有任何侵权问题，请及时联系号主以便删除。来源：晓飞的算法工程笔记公众号，转载请注明出处论文: Open-RAG: Enhanced Retrieval-Augmented Reasoning with Open-Source Large Lang 阅读全文

posted @ 2024-11-21 09:30 晓飞的算法工程笔记阅读(218) 评论(1) 推荐(2) 编辑

2024年11月20日

MaskLLM：英伟达出品，用于大模型的可学习`N:M`稀疏化 | NeurIPS'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models 论文地址：https://arxiv.org/abs/2409.17481 论文代码：https:// 阅读全文

posted @ 2024-11-20 09:11 晓飞的算法工程笔记阅读(136) 评论(0) 推荐(0) 编辑

2024年11月19日

VL4AD：让语义分割认识未知类别，无需额外数据和训练的OOD语义分割 | ECCV'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: VL4AD: Vision-Language Models Improve Pixel-wise Anomaly Detection 论文地址：https://arxiv.org/abs/2409.17330 创新性提出VL4AD模型用于解阅读全文

posted @ 2024-11-19 10:38 晓飞的算法工程笔记阅读(96) 评论(0) 推荐(0) 编辑

2024年11月18日

MoD：轻量化、高效、强大的新型卷积结构 | ACCV'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: CNN Mixture-of-Depths 论文地址：https://arxiv.org/abs/2409.17016 创新点提出新的卷积轻量化结构MoD，在卷积块（Conv-Blocks）内通过动态选择特征图中的关键通道进行集中处理，提高阅读全文

posted @ 2024-11-18 09:41 晓飞的算法工程笔记阅读(183) 评论(0) 推荐(1) 编辑

2024年11月15日

如何利用1%的数据优化特定领域LLM预训练？ | EMNLP'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: Target-Aware Language Modeling via Granular Data Sampling 论文地址：https://arxiv.org/abs/2409.14705 创新点提出了一种将预先训练好的标记符与多粒度标记阅读全文

posted @ 2024-11-15 09:24 晓飞的算法工程笔记阅读(147) 评论(0) 推荐(0) 编辑

2024年11月14日

AlignSum：数据金字塔与层级微调，提升文本摘要模型性能 | EMNLP'24

摘要：来源：晓飞的算法工程笔记公众号，转载请注明出处论文: AlignSum: Data Pyramid Hierarchical Fine-tuning for Aligning with Human Summarization Preference 论文地址：https://arxiv.org/a 阅读全文

posted @ 2024-11-14 09:49 晓飞的算法工程笔记阅读(102) 评论(0) 推荐(0) 编辑

晓飞的算法工程笔记

公告