会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
19
20
21
22
23
24
25
26
27
···
151
下一页
2025年7月19日
GQNN框架:让Python开发者轻松构建量子神经网络
摘要: 随着人工智能技术的快速发展,其计算复杂性需求也在不断提升。传统的经典神经网络在图像识别、自然语言处理等领域取得了显著成就,然而在处理指数级规模数据集或高度纠缠的复杂问题空间时,受限于经典计算的本质局限性,其性能增长逐渐趋于瓶颈。量子神经网络(Quantum Neural Networks, QNNs
阅读全文
posted @ 2025-07-19 21:15 deephub
阅读(50)
评论(0)
推荐(0)
2025年7月18日
差分隐私机器学习:通过添加噪声让模型更安全,也更智能
摘要: 在敏感数据训练的机器学习模型中,个人信息通过推理攻击泄露的风险日益凸显。本文探讨如何在模型训练过程中平衡实用性与形式化隐私保证这一关键问题。我们采用带有噪声梯度更新的模拟DP-SGD算法实现差分隐私机器学习。实验结果表明,该模型在保持71%准确率和0.79 AUC的同时,展现出良好的泛化能力,但在少
阅读全文
posted @ 2025-07-18 20:27 deephub
阅读(29)
评论(0)
推荐(0)
2025年7月17日
AI代理内存消耗过大?9种优化策略对比分析
摘要: 在AI代理系统的架构设计中,虽然多代理协作可以提升系统的整体准确性,但对话式AI的性能优化远不止于此。内存管理已成为影响系统性能的关键因素之一。 随着AI代理与用户的对话深度和长度不断增加,其内存消耗呈指数级增长。这种增长主要源于系统需要维护的多个组件,包括历史上下文存储、工具调用记录、数据库查询结
阅读全文
posted @ 2025-07-17 19:14 deephub
阅读(34)
评论(0)
推荐(0)
2025年7月16日
SingLoRA:单矩阵架构减半参数量,让大模型微调更稳定高效
摘要: 随着深度学习模型规模的不断扩大,模型微调在保持性能的同时面临着计算成本和内存消耗的双重挑战。低秩适应(LoRA)技术通过引入低秩矩阵分解有效缓解了这一问题,但在实际应用中仍存在训练稳定性和参数效率方面的局限性。 SingLoRA作为一种创新的低秩适应方法,通过摒弃传统的双矩阵架构,采用单矩阵对称更新
阅读全文
posted @ 2025-07-16 15:57 deephub
阅读(18)
评论(0)
推荐(0)
2025年7月15日
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
摘要: 对于 Python 数据处理的初学者而言,早期的 Pandas 代码往往充斥着基础的 .head() 、 .dropna() 调用以及大量的在线搜索。然而,掌握一些核心的处理模式后,Pandas 将展现出其快速、表达力强且优雅的特性。 本文将介绍 10 个在数据处理中至关重要的 Pandas 技术模
阅读全文
posted @ 2025-07-15 16:08 deephub
阅读(11)
评论(0)
推荐(0)
2025年7月14日
让大语言模型在不知道答案时拒绝回答:KnowOrNot框架防止AI幻觉
摘要: 在政府AI服务部署中,一个关键的技术挑战是如何确保系统在面对超出其知识范围的查询时能够恰当地承认信息不足,而非产生误导性的回答。考虑这样一个场景:公民通过政府AI聊天机器人查询MediShield每个保单年度的最高索赔限额,系统回答为" 150,000"。但是自2025年4月起,该限额已调整至200
阅读全文
posted @ 2025-07-14 17:36 deephub
阅读(16)
评论(0)
推荐(0)
2025年7月13日
贝叶斯状态空间神经网络:融合概率推理和状态空间实现高精度预测和可解释性
摘要: 在监督学习任务中,特别是二元分类问题的建模过程中,传统神经网络虽然在预测精度方面表现优异,但在解释模型决策过程和预测结果的合理性方面存在显著不足。为了解决这一问题,本文提出了贝叶斯状态空间神经网络(Bayesian State-Space Neural Networks, BSSNN)框架。该框架通
阅读全文
posted @ 2025-07-13 11:16 deephub
阅读(44)
评论(0)
推荐(0)
2025年7月12日
构建高性能LLM推理服务的完整方案:单GPU处理172个查询/秒、10万并发仅需15美元/小时
摘要: 在构建智能代理、检索增强生成(RAG)系统或大语言模型应用时,核心组件往往是通过API访问的大语言模型(LLM)。专业的服务提供商通过模型优化技术实现高效且可扩展的推理服务。 这些优化技术主要包括权重量化(W4A16、W4A8等)、键值缓存(KV Cache)、推测解码(Speculative De
阅读全文
posted @ 2025-07-12 11:00 deephub
阅读(22)
评论(0)
推荐(0)
2025年7月11日
ViTAR:模糊位置编码让视觉Transformer适配任意分辨率图像
摘要: 视觉Transformer在计算机视觉领域展现出强大的性能,但其对输入图像尺寸的严格约束限制了在实际应用中的灵活性。ViTAR(Vision Transformer with Any Resolution)通过引入模糊位置编码技术,实现了对任意分辨率图像的处理能力,为计算机视觉的实际应用开辟了新的技
阅读全文
posted @ 2025-07-11 13:41 deephub
阅读(18)
评论(0)
推荐(0)
2025年7月10日
强化学习算法基准测试:6种算法在多智能体环境中的表现实测
摘要: 强化学习作为机器学习领域的重要分支,通过智能体与环境的交互来学习最优决策策略。在单智能体环境中,智能体面临的是相对静态的环境动态,而多智能体环境则引入了更为复杂的交互机制和竞争关系,这为强化学习算法的设计和评估带来了全新的挑战。 现实世界中的许多决策问题涉及多个智能体的同时参与,如游戏对战、市场竞争
阅读全文
posted @ 2025-07-10 12:07 deephub
阅读(40)
评论(0)
推荐(0)
上一页
1
···
19
20
21
22
23
24
25
26
27
···
151
下一页
公告