会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
47
48
49
50
51
52
53
54
55
···
152
下一页
2024年10月10日
稀疏促进动态模态分解(SPDMD)详细介绍以及应用
摘要: 在数据驱动分析领域,从复杂流体流动中提取有意义的模式一直是一个重大挑战。稀疏促进动态模态分解(Sparsity Promoting Dynamic Mode Decomposition, SPDMD)提供了一种有效方法,能够揭示最主要的特征,同时去除冗余信息,从而实现更高效和更具洞察力的分解。这种方
阅读全文
posted @ 2024-10-10 09:53 deephub
阅读(203)
评论(0)
推荐(0)
2024年10月8日
图像数据增强库综述:10个强大图像增强工具对比与分析
摘要: 在深度学习和计算机视觉领域,数据增强已成为提高模型性能和泛化能力的关键技术。本文旨在全面介绍当前广泛使用的图像数据增强库,分析其特点和适用场景,以辅助研究人员和开发者选择最适合其需求的工具。 数据增强在深度学习模型训练中扮演着至关重要的角色,其重要性主要体现在以下几个方面: 增加数据多样性:通过对现
阅读全文
posted @ 2024-10-08 09:44 deephub
阅读(187)
评论(0)
推荐(0)
2024年10月7日
FredNormer: 非平稳时间序列预测的频域正则化方法
摘要: 时间序列预测是一个具有挑战性的任务,尤其是在处理非平稳数据时。现有的基于正则化的方法虽然在解决分布偏移问题上取得了一定成功但仍存在局限性。这些方法主要在时间域进行操作,可能无法充分捕捉在频域中更明显的动态模式,从而导致次优的结果。 FredNormer论文的研究目的主要包括: 理论分析现有正则化方法
阅读全文
posted @ 2024-10-07 09:38 deephub
阅读(126)
评论(0)
推荐(0)
2024年10月6日
模型无关的局部解释(LIME)技术原理解析及多领域应用实践
摘要: 在当前数据驱动的商业环境中,人工智能(AI)和机器学习(ML)已成为各行业决策制定的关键工具。从金融机构的信贷风险预测到医疗保健提供者的疾病诊断,AI模型正在塑造对生活和业务有深远影响的结果。 然而随着这些模型日益复杂化,一个重大挑战浮现:即"黑盒"问题。许多先进的AI模型,尤其是深度学习算法,其运
阅读全文
posted @ 2024-10-06 10:02 deephub
阅读(326)
评论(0)
推荐(0)
2024年10月5日
PAIRDISTILL: 用于密集检索的成对相关性蒸馏方法
摘要: 在当今海量数据时代,有效的信息检索(IR)技术对于从庞大数据集中提取相关信息至关重要。近年来,密集检索技术展现出了相比传统稀疏检索方法更加显著的效果。 现有的方法主要从点式重排序器中蒸馏知识,这些重排序器为文档分配绝对相关性分数,因此在进行比较时面临不一致性的挑战。为解决这一问题,来自国立台湾大学的
阅读全文
posted @ 2024-10-05 20:03 deephub
阅读(44)
评论(0)
推荐(0)
2024年10月4日
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法
摘要: 随着大型语言模型(LLMs)的迅速普及,如何有效地引导它们生成安全、适合特定应用和目标受众的内容成为一个关键挑战。例如,我们可能希望语言模型在与幼儿园孩子互动时使用不同的语言,或在撰写喜剧小品、提供法律支持或总结新闻文章时采用不同的风格。 目前,最成功的LLM范式是训练一个可用于多种任务的大型自回归
阅读全文
posted @ 2024-10-04 14:01 deephub
阅读(89)
评论(0)
推荐(0)
2024年10月3日
SCoRe: 通过强化学习教导大语言模型进行自我纠错
摘要: 大语言模型(LLMs)在推理任务中,如数学问题求解和编程,已经展现出了优秀的性能。尽管它们能力强大,但在实现能够通过计算和交互来改进其回答的算法方面仍然面临挑战。现有的自我纠错方法要么依赖于提示工程,要么需要使用额外的模型进行微调,但这些方法都有局限性,往往无法产生有意义的自我纠错。 这是谷歌9月发
阅读全文
posted @ 2024-10-03 11:56 deephub
阅读(70)
评论(0)
推荐(0)
2024年10月2日
VisionTS:基于时间序列的图形构建高性能时间序列预测模型,利用图像信息进行时间序列预测
摘要: 构建预训练时间序列模型时面临的主要挑战是什么?获取高质量、多样化的时间序列数据。目前构建基础预测模型主要有两种方法: 迁移学习LLM:通过针对时间序列任务定制的微调或分词策略,重新利用预训练的大型语言模型(LLM),如GPT-4或Llama。 从零训练:构建大规模时间序列数据集,并从头开始预训练模型
阅读全文
posted @ 2024-10-02 19:58 deephub
阅读(121)
评论(0)
推荐(0)
2024年10月1日
闭源与开源嵌入模型比较以及提升语义搜索效果的技术探讨
摘要: 闭源与开源嵌入模型比较以及提升语义搜索效果的技术探讨 上图为执行语义搜索前的聚类演示 ,嵌入技术是自然语言处理的核心组成部分。虽然嵌入技术的应用范围广泛,但在检索应用中的语义搜索仍是其最常见的用途之一。 https://avoid.overfit.cn/post/38350e175fa0424b8c
阅读全文
posted @ 2024-10-01 10:20 deephub
阅读(61)
评论(0)
推荐(0)
2024年9月30日
Minstrel自动生成结构化提示,让AI为AI写提示词的多代理提示生成框架
摘要: 在人工智能快速发展的今天,如何有效利用大型语言模型(LLMs)成为了一个普遍关注的话题。这是9月份的一篇论文,提出了LangGPT结构化提示框架和Minstrel多代理提示生成系统,为非AI专家使用LLMs提供了强大支持。 对于非人工智能专家来说,构建高质量的提示以充分利用LLMs的能力仍然是一个巨
阅读全文
posted @ 2024-09-30 10:00 deephub
阅读(65)
评论(0)
推荐(0)
上一页
1
···
47
48
49
50
51
52
53
54
55
···
152
下一页
公告