上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 234 下一页

2025年2月18日

PromptWizard:微软开源 AI 提示词自动化优化框架

摘要: ‌PromptWizard‌是一个由微软研究院开发的自动化提示词优化框架,旨在改进大型语言模型(LLMs)在特定任务中的表现。该框架通过自我演变和自我适应机制,利用反馈驱动的批评和合成过程,迭代优化提示指令和上下文示例,从而提高模型的准确性和效率‌12。 主要功能和技术原理 PromptWizard 阅读全文

posted @ 2025-02-18 11:40 ExplorerMan 阅读(619) 评论(0) 推荐(0)

Flow-DPO通过在线多Agent学习提升LLM的数学推理能力

摘要: ‌Flow-DPO‌是一种通过在线多智能体学习来提升LLM(大型语言模型)数学推理能力的新方法。Flow-DPO结合了在线学习流(Flow)和直接偏好优化(DPO),通过两个独立的语言模型互相协作,纠正对方的错误,从而生成更加准确和详细的推理轨迹‌12。 工作原理 Flow-DPO的核心在于构建两个 阅读全文

posted @ 2025-02-18 11:27 ExplorerMan 阅读(105) 评论(0) 推荐(0)

2025年2月17日

2024年大模型 对比

摘要: 自OpenAI在2022年12月发布GPT-3.5模型驱动的ChatGPT以来,生成式AI就如火如荼地展开了一场声势浩大的「军备竞赛」。 而仅仅不到两年,多个实验室就都已经赶上了OpenAI的GPT-4,甚至出现了第一批超越GPT-4o智能水平的模型。例如:Claude 3.5 Sonnet,Gem 阅读全文

posted @ 2025-02-17 20:54 ExplorerMan 阅读(108) 评论(0) 推荐(0)

谷歌新一代大模型Gemini 2.0

摘要: 继量子芯片之后,谷歌又来抢“OpenAI双12直播”的流量了! 就在刚刚,谷歌新一代大模型Gemini 2.0突然登场,再次由谷歌CEO皮猜亲自官宣。 新一代模型专为AI Agent而打造,谷歌表示目前已经将2.0版本提供给了一些开发者内测,正在迅速将其集成在Gemini和搜索等产品线中。 好消息是 阅读全文

posted @ 2025-02-17 20:47 ExplorerMan 阅读(161) 评论(0) 推荐(0)

大模型在陌陌的推理与应用

摘要: 导读 本文将分享陌陌如何利用大模型技术革新其业务与研发流程。 主要内容包括以下几个部分: 1. AI 应用范式更新 2. 大模型高效推理 3. 大模型应用平台 4. 未来展望 5. 总结 6. Q&A 分享嘉宾|陈玉祥 挚文集团 算法工程专家 编辑整理|王文海 内容校对|李瑶 出品社区|DataFu 阅读全文

posted @ 2025-02-17 20:19 ExplorerMan 阅读(127) 评论(0) 推荐(0)

2024年大模型推理优化论文精选

摘要: OSDI (USENIX Symposium on Operating Systems Design and Implementation) 和SOSP (ACM Symposium on Operating Systems Principles) 是计算机操作系统领域最重要的两大国际会议,在国际上 阅读全文

posted @ 2025-02-17 20:17 ExplorerMan 阅读(546) 评论(0) 推荐(0)

2025年2月14日

DeepSeek-R 与 DeepSeek-V 区别

摘要: DeepSeek-R1和DeepSeek-V3是深度求索推出的两款大模型,它们在设计目标、架构、训练方法、性能表现和应用场景等方面存在显著差异,以下是具体对比: 1. 模型定位与核心能力 DeepSeek-V3:通用型自然语言处理模型,专注于多语言生成、知识问答、内容创作等任务,优势在于高效的多模态 阅读全文

posted @ 2025-02-14 16:48 ExplorerMan 阅读(2217) 评论(0) 推荐(0)

2025年2月13日

深度学习中常用的开源数据集

摘要: Kaggle(https://www.kaggle.com/datasets):Kaggle 是一个著名的数据科学竞赛平台,也提供了大量的开放数据集供用户下载和使用。UCI Machine Learning Repository(https://archive.ics.uci.edu/dataset 阅读全文

posted @ 2025-02-13 14:39 ExplorerMan 阅读(1187) 评论(0) 推荐(0)

LLM时代,数据为王,19个开源数据集下载网站汇总

摘要: 大模型时代,数据为王,在哪里寻找开源数据集,是一个比较头疼的问题。经过调研整理,下面列出了目前可以寻找开源大模型数据集的网站清单。 1、HuggingFace开源数据集 链接:https://huggingface.co/datasets 镜像:https://hf-mirror.com/datas 阅读全文

posted @ 2025-02-13 14:36 ExplorerMan 阅读(3824) 评论(0) 推荐(0)

模型训练学习率设置

摘要: 在大语言模型训练中,学习率的调整策略对模型的收敛速度和最终性能至关重要。以下是一些常用的学习率调整方法和建议: 1. 固定学习率(Constant Learning Rate) 固定学习率是最简单的方法,学习率在整个训练过程中保持不变。这种方法适用于简单的任务或小规模模型,但在大规模模型训练中可能不 阅读全文

posted @ 2025-02-13 11:45 ExplorerMan 阅读(515) 评论(0) 推荐(0)

上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 234 下一页

导航